Mundarija: Kirish i-bob. Filogenetik daraxtni yaratish


II-Bob. Filogenetik daraxtlarni tuzish algoritmlari



Download 272,77 Kb.
bet8/12
Sana09.06.2023
Hajmi272,77 Kb.
#950134
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
Filogenetik daraxtlarni tuzish algoritmlari

II-Bob. Filogenetik daraxtlarni tuzish algoritmlari
2.1. Filogenetik daraxtlarni tuzish algoritmlari
Filogenetik daraxtlar qurilishi - bu bioinformatika fanining murakkab va keng o'rganilgan muammosi. NP-Complete xususiyatlaridan kelib chiqqan holda, bu tadqiqotchilar uchun haligacha ochiq muammo. Turlar sonining ko'payishi bilan hisoblashning murakkabligi ham oshadi, uni an'anaviy usullar bilan hal qilib bo'lmaydi (masalan, arifmetik o'rtacha ko'rsatkichlar (UPGMA), Maksimal ehtimollik, Maksimal Parsimoniya). , Ba'zi metaevristik usullar bir qancha tadqiqotchilar tomonidan o'rganilmoqda va filogenetik daraxt qurildi va ba'zi istiqbolli natijalar haqida xabar berdi. Ushbu maqolada filogenetik daraxt rekonstruksiyasini optimallashtirish uchun ishlatilgan chumolilar koloniyasini optimallashtirish (ACO), zarrachalar to'dasini optimallashtirish (PSO) va genetik algoritm (GA) kabi ba'zi metauristik yondashuvlar haqida qisqacha so'rov berilgan.
Filogenetik [19] - bu turli xil tirik organizmlarning evolyutsion tarixini o'rganish usuli, bu erda turlar orasidagi farqlar filogeniya deb nomlanuvchi yo'naltirilgan grafikalar yoki daraxtlar bilan ifodalanadi. Daraxt har xil turlarning molekulyar ketma -ketligi asosida qurilgan. Molekulyar ketma -ketlikning namoyishi genlar filogeniyasi deb nomlanuvchi genlar yoki oqsillar ketma -ketligidan kelib chiqadi, filogeniya turlari esa har xil turlarning evolyutsion yo'lini ifodalovchi jarayon sifatida ta'riflanadi. Gen filogeniyasi turli genlar o'rtasidagi o'zaro bog'liqlikni, ya'ni turli genlar orasidagi genlar ketma-ketligi bir-biri bilan ko'proq yoki kamroq bog'liqligini bilishga yordam beradigan gen evolyutsiyasini va kodlangan gen ketma-ketligini tavsiflovchi mahalliy tavsiflovchi sifatida bo'lishi mumkin. Daraxtlarning asosan ikki turi bor a). ildizli daraxtlar: barcha tugunlar bitta tugundan olingan va b) ildizi yo'q daraxtlar: bitta tugundan hosil bo'lmaganlar.
Tuzilgan daraxt turlar o'rtasidagi munosabatni ifodalash uchun tugunlar turini ifodalovchi grafik nazariya standarti belgisiga amal qilishi kerak. Qolgan maqolalar quyidagicha tartibga solinadi: 2 -bo'limda genetik algoritm, so'ngra GA yordamida filogenetik daraxtni optimallashtirish bo'yicha ishlar olib boriladi. 3 -bo'limda chumolilar koloniyasini optimallashtirishning kiritilishi, 4 -bo'limda filogenetik daraxtni qurishda qo'llaniladigan GA va ACOdan boshqa usullar tasvirlangan. Oxirida 5 -bo'lim. Qog'oz yakunlanadi.
Genetik algoritm [2] - bu tabiiy evolyutsiyadan ilhomlangan texnikaga asoslangan evristik qidiruv algoritmi, irsiyat, mutatsiya, tanlash va krossover kabi. GA kodlangan tasodifiy yechimlar populyatsiyasi bilan boshlanadi. Bunday kodlangan yechimlar odatda xromosomalar deb ataladi va ularning muammoni hal qilish qobiliyati fitnes funksiyasi yordamida tavsiflanadi. Bu odamlar fitnes qiymatiga qarab tabiiy tanlanishdan o'tadilar. Har bir avlodda shaxslar mutatsiyaga va rekombinatsiyaga uchraydilar, bunda muammoning xarakteriga qarab mutatsiya va rekombinatsiya operatorlari aniqlanadi. Keyin yangi populyatsiya algoritmning keyingi iteratsiyasida ishlatiladi. Algoritm odatda natijani beradigan yechim kerakli javobga etarlicha yaqin yoki teng bo'lganda yoki aholi uchun qoniqarli moslik darajasiga erishilganda tugaydi. B bo'limida biz daraxtlarni filogenetik rekonstruksiya qilishda genetik algoritm qanday qo'llanilishini muhokama qilamiz, so'ngra C bo'limida genetik algoritm orqali filogenetik daraxtni qurish uchun bir nechta tadqiqotchilar tomonidan bajarilgan ishlarni tasvirlaymiz.
GA ko'p yillar davomida muhandislikning turli xil murakkab muammolariga qo'llanilgan, garchi ulardan biologik ma'lumotlar bilan bog'liq muammolarda qo'llanilishi bir necha yil oldin o'rganilgan bo'lsa-da, GA ning murakkab ma'lumotlar holatida tezda deyarli optimal echimlarni topish qobiliyati ularni qiladi. Filogenetik xulosa chiqarish muammosiga ideal nomzodlar, ayniqsa, ko'plab soliqlar kiritilganida yoki murakkab evolyutsion modellar (maksimal ehtimollik kabi kompyuter intensiv xulosa chiqarish usullarini qo'llashni talab qiladigan) qo'llanilganda. Filogeniya rekonstruksiya qilingan taqdirda, har bir shaxsning yagona xromosomasi bitta filogenetik daraxtni, uning shoxlari uzunligi va ishlatiladigan almashtirish modelini o'z ichiga olgan boshqa parametrlarning qiymatlari bilan kodlash uchun mo'ljallangan bo'lishi mumkin. Mutogenlik va rekombinatsiya operatorlari filogenetik daraxtlar uchun aniqlanishi mumkin va odamning jismoniy tayyorgarligi uning tabiiy balliga teng bo'lishi mumkin. LnL qiymatlari yuqori bo'lgan daraxtlar keyingi avlodga ko'proq avlod qoldirishga moyildirlar va tabiiy tanlanish simulyatsiya qilingan populyatsiyadagi odamlarning o'rtacha miqdorini oshiradi. Aholining jismoniy holati yaxshilanishni to'xtatgandan keyin eng yuqori lNLga ega bo'lgan daraxt, ehtimollik ehtimoli yuqori bo'lgan daraxtning eng yaxshi bahosi hisoblanadi
Hideo Matsuda [5] (1996) aminokislotalar ketma -ketligidan filogenetik daraxtlar yaratishni taklif qildi, bu genetik algoritmdan farq qiladi, bu kodlash sxemasi, o'zaro faoliyat va mutatsion operatori asosida oddiy genetik algoritmdan [2] farq qiladi. Dastlabki bosqichda, mavjudlar orasidamuqobil daraxtlar, ularning yaroqliligiga qarab rulet tanlash orqali belgilangan miqdordagi daraxtlar tanlangan. Shundan so'ng daraxtlarning sifatini yaxshilash uchun avloddan -avlodga krossover va mutatsion operatsiyalar qo'llanildi. Har bir avloddagi daraxtlar soni aniqlanganligi sababli, eng yaxshi ball to'plagan daraxtlar ushbu operatorlar tomonidan olib tashlanadi. Algoritm shuningdek, eng yaxshi ball bilan qurilgan daraxt har bir avlod uchun omon qolishi kerakligini tekshiradi. Algoritmning asosiy afzalligi uning tasodifiy hosil bo'lgan daraxtlardan krossover va mutatsiya operatorlari yordamida ko'proq ehtimoliy daraxt qurish qobiliyatidir. Eksperimental natijalar shuni ko'rsatadiki, taklif qilingan algoritmning ishlashi boshqa Maksimal Parsimon Maksimal ehtimoli, UPGMA usullari kabi turli xil daraxt qidirish algoritmlari bilan solishtirish mumkin.
Filogeniyani rekonstruktsiya qilish - bu qiyin hisoblash muammosi, chunki ko'p miqdordagi soliqlar (ob'ektlar) ni o'z ichiga olgan holda, mumkin bo'lgan echimlar ham ko'payadi, bu esa optimal bo'lmagan daraxtlarni baholashga sarflanadigan vaqtni oshiradi. Bu muammoni bartaraf etish uchun Paul.et.al [8] (1998) nukleotidlar ketma-ketligi ma'lumotlaridan foydalanib, maksimal ehtimollik filogenezi xulosasi uchun genetik algoritmni taklif qildi. Pavlus genetik algoritmga asoslangan evristik qidiruvni taqdim etadi, bu ko'p sonli taksonlarni o'z ichiga olgan ma'lumotlar to'plamida maksimal ehtimollik filogenetik xulosa qilish uchun zarur bo'lgan vaqtni kamaytiradi. Algoritm quyidagicha ishlaydi: Birinchidan, har bir shaxs tasodifiy daraxt topologiyasi bilan ishga tushiriladi, unda har bir filialga tasodifiy qiymat beriladi. InL ball asosida har bir zarrachaning yaroqlilik qiymati hisoblanadi. InL balining eng yuqori qiymatiga ega bo'lgan shaxs keyingi avlod uchun nasl berish uchun ishlatiladi. Nihoyat, rekombinatsiya operatsiyasi amalga oshiriladi. Bu rekombinatsiya operatsiyasi GAni boshqa an'anaviy echimlardan kamroq vaqt ichida yechim olishdan ajratib turadi. Eksperimental natijalar shuni ko'rsatadiki, bir xil Maksimal ehtimollik topologiyasini olish uchun daraxtning ikkiga bo'linishi (TBR) novdalarini almashtirishdan foydalangan holda an'anaviy evristik qidiruv uchun talab qilinadigan hisoblash harakatlarining atigi 6%.
2002 yilda Clare et. al [10] taklif qilgan "Gaphyl: organizmlar o'rtasidagi evolyutsion munosabatlarni o'rganish uchun evolyutsion algoritmlar yondashuvi". Mavjud filogenetik dasturiy paketlar optimal filogenetik daraxtni topish uchun evristik qidiruv usullaridan foydalanadi, Graphyl esa evolyutsion mexanizmlardan foydalanadi, shuning uchun qisqa vaqt ichida to'liqroq yechim topadi. Grafildagi GA qidirish jarayoni filogenetika uchun xuddi shu ish vaqtida Phylip [3] ga qaraganda bir xil darajada ishonchli daraxtlarni topishda katta foyda keltiradi. Bundan tashqari, ma'lumotlar to'plami turlar va atributlar sonining ko'payishi hisobiga kattalashib borgan sari, Gafilning Filip ustidan samaradorligi oshadi, chunki Gafil qidirish jarayoni atributlar (va atributlar-qiymatlar) soniga va qidirishning murakkabligiga bog'liq emas. daraxtdagi barg tugunlari sonini aniqlaydigan turlar soniga qarab o'zgaradi.
Gafil Kler. va boshqalar. al [12] (2003) Gafilning yangi versiyasini taklif qildi, unda Gafil genetik ma'lumotlar bilan ishlash uchun kengaytirilgan. Taklif etilgan algoritmda Gafilning DNK versiyasi tuzilgan va DNK ma'lumotlari asosida Gafil va Filipni qidirish jarayoni solishtirilgan. Eksperimental natijalar shuni ko'rsatadiki, Gafilning ishlashi, ba'zi hollarda, Filipga qaraganda yaxshiroq.
Chumolilar koloniyasini optimallashtirish (ACO) M. Dorigo tomonidan ishlab chiqilgan evolyutsiya algoritmidir. va boshqalar. al [6] (1996), haqiqiy chumolilarning ovchilik xatti -harakatlaridan ilhomlangan. Chumoli ovqatni qidirganda, chumoli dastlab uyasi bilan qoplangan joyni tasodifiy ravishda siljitadi. Chumoli oziq -ovqat manbasini topgach, uning sifati va miqdorini tahlil qilib, uning bir qismini uyasiga qaytaradi. Kimyoviy feromon izi chumoli qaytib kelganida erga tushiriladi. Bu boshqa chumolilarga oziq -ovqat manbalariga etib borishiga yordam beradi. Feromon yo'llari orqali chumolilar o'rtasidagi bilvosita aloqa yordamida uya va oziq-ovqat manbai o'rtasidagi eng qisqa yo'lni topishga yordam beradi. Chumolilar koloniyalarining bu xususiyati sun'iy chumolilar koloniyalarida kombinativ optimallashtirish (CO) muammolarini hal qilish uchun ishlatiladi. Umuman olganda, ACO optimallashtirish muammolarini hal qilish uchun ikki bosqichni takrorlaydi.
1) Nomzodlik eritmasi feromonli model yordamida quriladi, ya'ni eritma maydonida ehtimollik taqsimotini parametrlangan holda ishlatish.
2) Nomzod echimlar yaxshi sifatli eritma olishda filtrlash uchun ferom qiymatlarini yangilash yoki o'zgartirish uchun ishlatiladi.
B bo'limida biz filogenetik daraxtlarni rekonstruksiya qilishda chumolilar koloniyasini optimallashtirish (ACO) qanday qo'llanilishini muhokama qilamiz, so'ngra C bo'limida bir qancha tadqiqotchilar chumolilar koloniyasini optimallashtirish orqali filogenetik daraxtni qurish uchun qilgan ishlarini tasvirlab beramiz.
Filogenetik daraxt qurilishi muammosi standart TSP (sayohatchi sotuvchi muammosi) ga juda o'xshash. Har bir taksiga bitta xayoliy shaharni bog'lash mumkin va bu mos keladigan taksilar juftligi uchun ma'lumotlar matritsasidan olingan ma'lumotlar ikki shahar orasidagi masofa sifatida belgilanadi. Muammoning bunday tuzilishi ACO kabi evristik algoritmlarni qo'llashga yo'l ochadi, vositachi tugun chumolilar tizimi tomonidan ilgari tanlangan ikkitasi orasidan tanlanadi. Vositachilik tuguniga asoslanib, qolgan tugunlarga (turlarga) bo'lgan masofalar qayta hisoblab chiqiladi. Ushbu protsedura, tashrif buyurilgan tugunlarga tegishli bo'lmagan barcha tugunlar yo'l qurilgunga qadar takrorlanadi. Yo'lning qo'shni tugunlarining o'tish ehtimoli yig'indisi feromon izini yangilashda foydalanilgan yo'lning balli deb ataladi. Amalga oshirish tsikli davomida hech bo'lmaganda bitta yo'lga tegishli bo'lgan barcha tugunlar feromon izini oshirishga yordam beradi. Bu asosiy nuqta mahalliy maksimal tuzoqqa tushmaslikka yordam beradi. Shunday qilib, TSPni echish uchun chumolilar koloniyasi algoritmiga ruhiy jihatdan yaqin bo'lgan algoritmga amal qilib, filogenetik daraxtlarni samarali rekonstruksiya qilish mumkin .
Shin Ando.et.al [11] (2002) Evolyutsion daraxt qurilishi uchun chumolilar algoritmini taklif qildi. Algoritm NP muammolarida metaevristik qidiruvni o'rganish uchun ACO algoritmini qo'llaydi. Muallif ikkita yangi mexanizmni taqdim etadi: qo'shimchani ifodalash va tepalik tanlash mexanizmi, bu chumolilar koloniyasini o'rganish qobiliyatini takomillashtirish [7] strategiyasini qo'llashda yordam beradi. Algoritm mumkin bo'lgan daraxtlar to'plamidan daraxt tanlaydi, bu ma'lum bir DNK ketma -ketligi uchun balni kamaytiradi. Taklif etilgan algoritm simulyatsiya qilingan eksperimentda va 15 turdan oqsil ketma -ketligini moslashtirishda qoniqarli natijalarni ko'rsatadi.
Pist Kumnorkaew.et.al [15] (2004) Chumolilar koloniyasiga asoslangan yangi algoritmni taklif qildi, unda evolyutsion daraxt daraxt konstruktsiyasi, novdalar uzunligini hisoblash, filial nuqtasini tanlash, yangi ACO parametri va masofani tortish parametri. Algoritm chumolilarni turli filial nuqtalariga joylashtirishdan boshlanadi va har bir chekkada feromon izining boshlang'ich qiymatini o'rnatadi. Tarmoq nuqtasi tanlash vektoridagi har bir chumolining filial nuqtasi tartiblangandan so'ng, har bir chumoli feromon izi va masofasidan kelib chiqib, keyingi bosqichga o'tish uchun shaharlarni tanlaydi. Algoritm shaharni tanlash va har bir chumolining harakatini barcha chumolilar sayohatlari va filiallarini tugatmaguncha takrorlaydi.

Download 272,77 Kb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©www.hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish