Программа анализа тональности текстов на основе методов



Download 172,46 Kb.
bet5/14
Sana05.02.2023
Hajmi172,46 Kb.
#908004
TuriРеферат
1   2   3   4   5   6   7   8   9   ...   14
Bog'liq
диплом ПЗ Вишневская 472ПИ

Постановка задачи


Целью настоящего дипломного проекта является реализация программы для сентимент-анализа рецензий на основе методов машинного обучения с учителем. Для достижения этой цели необходимо решить следующие задачи:

  1. Исследовать несколько векторных моделей представления текста (униграммы, биграммы) и фунций весов (бинарная, частотная). Выбрать то сочетание модели языка и весов, которое даст наилучший показатель точности на данной выборке.

  2. Исследовать и реализовать несколько классифицирующих алгоритмов (в т.ч. наивный Байесовский алгоритм и алгоритм k ближайших соседей). Выбрать алгоритм, дающий наибольший уровень точности на конкретной обучающей выборке.



2. Разработка проекта решения



    1. Этапы решения


Процесс разработки программы сентимент-анализа в рамках настоящего исследования, схож с процессом разработки любой другой программы на основе методов машинного обучения. Методы машинного обучения с учителем требуют наличия обучающей выборки. После того, как обучающая выборка сформирована, каждый экземпляр из выборки выражается как вектор признаков. Далее, определяется тональность (позитивное или негативное отношение автора) для каждого элемента выборки – таким образом, классификатор будет обучаться в дальнейшем. После формирования векторов, реализуется какой-либо алгоритм классификации. Полученный классификатор далее обучается на основе изначальной выборки и становится пригодным для осуществления классификации новых текстов.
Результатом действий, описанных выше, будет программа анализа тональности текстов на основе методов машинного обучения.
Главной задачей, поставленной в настоящей работе, является реализация алгоритма определения тональной направленности текста на основе методов машинного обучения.
Решение этой задачи можно разбить на этапы:

  1. Выбор метрик для оценки эффективности алгоритмов.

  2. Выбор признаков, по которым будет осуществляться классификация.

  3. Выбор и реализация нескольких алгоритмов классификации.

  4. Создание обучающей выборки.

  5. Проверка эффективности алгоритмов.




    1. Download 172,46 Kb.

      Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   14




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©www.hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish