1. Axborotni izlash (qidirish) tushunchasi Axborotni qidirish jarayoni sifatida


Axborot qidirish tizimining asosiy vazifasi



Download 290,94 Kb.
bet10/10
Sana31.12.2021
Hajmi290,94 Kb.
#225374
1   2   3   4   5   6   7   8   9   10
Bog'liq
1-mavzu axborotni izlash va ajratib olish faniga kirish texnika-fayllar.org (1)

Axborot qidirish tizimining asosiy vazifasi - bu uning kalit so'zlari asosida axborot resursini identifikatsiya qilish atributini shakllantirishdir. Ushbu jarayon indeksatsiya deb ataladi va uning maqsadi har bir axborot resursini indekslar to'plami bilan moslashtirish (sarlavhalar, indekslash atamalari, kalit so'zlar, tavsiflovchilar, maydonlar va boshqalar).

Oddiy holatda, indekslash teskari ro'yxatni yaratishni anglatadi, unda har bir indeksatsiya atamasi u paydo bo'lgan hujjatlar ro'yxati bilan bog'liq.

 

Qidiruv sifatiga ta'sir qiluvchi eng muhim omillardan biri bu qidiruv tizimida hujjatlarni ichki ko'rinishda taqdim etishdir. An'anaviy tizimlarda uning o'rnini bosadigan va haqiqiy o'rniga qidirishda ishlatiladigan hujjatlarni qidirish tasviri (bundan keyin - POD) tushunchasi mavjud. Qidiruv tasviri - bu hujjatlar qatorining ma'lum bir modelini haqiqiy massivga qo'llash natijasidir.



 

Odatda hujjatlardagi ma'lumotlarni qidirish ushbu hujjatlar shartlarini foydalanuvchi so'rovidagi atamalar bilan taqqoslash orqali sodir bo'ladi. Ushbu usullarning ikkita muhim kamchiliklari mavjud. Birinchidan, odatda ma'lum bir kontseptsiyani ifodalashning ko'plab usullari mavjud (sinonimlardan foydalangan holda), shuning uchun tegishli hujjatlar rad etilishi mumkin. Ikkinchidan, ko'p so'zlar ko'plik ma'nosini anglatadi (polisemiya), shuning uchun dastur natijasida keraksiz hujjatlar olinishi mumkin. Ushbu ikkita nuqson, foydalanuvchi so'roviga javob topish uchun atamalarni taqqoslashga asoslangan usullar qabul qilinishi mumkin emasligiga olib keladi. Keyinchalik samarali yondashuv foydalanuvchiga ma'lum bir hujjatning ma'nosini hisobga olgan holda ma'lumot olish imkoniyatini berishi kerak. Ushbu indekslash usullaridan eng keng tarqalgani: leksik, vektor, ehtimollik, yashirin semantik. Keling, usullarning har birining afzalliklari, kamchiliklari va qo'llanilish xususiyatlarini ko'rib chiqamiz.

Yaxshi taqsimotga qaramay, indekslashning ushbu turi muhim kamchiliklarga ega:

• mantiq algebra apparati oddiy foydalanuvchi tomonidan deyarli sezilmaydi;

• mutaxassislardan farqli o'laroq, foydalanuvchiga kalit so'zlar asosida so'rovni shakllantirish qiyin, ayniqsa bir xil so'zlar har xil ma'noga ega bo'lsa;

• qidiruv natijasi mutlaqo kontekstsiz bo'lib, uning dolzarbligini ancha pasaytiradi.

Vektorli indekslash har bir hujjatning leksik bo'shliqdagi so'zlar va vektorlarning chastota spektriga mos kelishiga asoslanadi. So'rovning chastotali javobi xuddi shu bo'shliqda vektor sifatida taqdim etiladi va eng muhim hujjatlar yaqinlik darajasi (vektorlar orasidagi masofa yoki burchak) bilan belgilanadi.

Axborotni aniq ma'noda berish muammosini hal qilish, uning rivojlanishida global tizim faol foydalanilgan:

• o'zingizning hujjat tuzilishingizni tavsiflash uchun XML tili;

• meta ma'lumotlar va kontekst ma'lumotlarini rasmiylashtirish uchun qulay muhit sifatida RDF (Resurs Definition Framework) tili;

• DTD (Document Type Definition, XML hujjatlari tuzilishining rasmiy tavsifi) va ta'riflar va atamalar ma'nosini oldindan kelishib olgan tomonlar o'rtasida ma'lumot almashish uchun XML standartida va XML sxemasida (XML sxemasi).

Xulosa


1.Ma’lumotlarni qayta ishlashda va ma’lumotlarni ma’lumotlar bazasiga          joylashtirishda qo’llaniladi.

2. Bu masalalar bilan malumotlarni intelletual tahlil qilish (data mining) shug’ullanadi.

3. Internetning rivojlanish kontseptsiyasi: Har bir hujjatga semantik to’r deb ataluvchi XML formatidagi meta ma’lumotli fayl biriktiriladi va juda istiqbolli hisoblanadi. Lekin bu hujjatning o’zini almashtirish (o’zgartirish) emasligini e’tiborga olish kerak.

Foydalanilgan manbalar:



1. Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval. — Addison-Wesley, 1999. — ISBN 0-201-39829-X.

2. Manning C., Raghavan P., Schütze H. Introduction to Information Retrieval. — Cambridge University Press, 2008. — ISBN 0-521-86571-9.3. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN 978-5-8459-1623-5

4. Ландэ Д. В., Снарский А. А., Безсуднов И. В. Интернетика: Навигация в сложных сетях: модели и алгоритмы. — M.: Либроком (Editorial URSS), 2009. — 264 с. — ISBN 978-5-397-00497-8
Download 290,94 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©www.hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish