Программа анализа тональности текстов на основе методов



Download 172,46 Kb.
bet1/14
Sana05.02.2023
Hajmi172,46 Kb.
#908004
TuriРеферат
  1   2   3   4   5   6   7   8   9   ...   14
Bog'liq
диплом ПЗ Вишневская 472ПИ


Правительство Российской Федерации

Федеральное государственное автономное образовательное учреждение
высшего профессионального образования

«Национальный исследовательский университет
«Высшая школа экономики»


Факультет Бизнес-информатика
Отделение Программной инженерии
Кафедра Управление разработкой программного обеспечения


ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА

На тему: Программа анализа тональности текстов на основе методов


машинного обучения


Студентка группы №472ПИ
______________ / Вишневская Н.И. /
«____» __________________ 2013 г.



Руководитель ВКР
доцент каф. УРПО, к.т.н.
________________ / Ахметсафина Р.З. /
«____» __________________ 2013 г.


Москва, 2013


Аннотация
В данной работе рассматривается проблема автоматической классификации текстов по тональности, описываются методы машинного обучения для решения этой проблемы. Приводится описание алгоритмов классификации: наивного Байесовского классификатора и алгоритма k ближайших соседей. Рассматриваются способы векторного представления документов обучающей и тестовой выборок, а также функции весов. Для каждого сочетания параметров рассчитываются метрики эффективности. Для оценки работы алгоритмов используется метод перекретной проверки. По результатам проверок, выбирается сочетание векторной модели языка, функции весов и классификатора с наибольшей оценкой точности.


Содержание


Введение 4
1. Обзор предметной области 7
1.1.Задача сентимент-анализа 7
1.2.Подходы к определению тональности текста 7
1.3.Обзор литературы 9
1.4.Постановка задачи 10
2. Разработка проекта решения 11
2.1.Этапы решения 11
2.2.Метрики эффективности 11
2.3.Векторная модель языка 12
2.4.Классификаторы 14
2.4.1.Наивный Байесовский классификатор 14
2.4.2. Метод k ближайших соседей 17
2.5.Создание обучающей выборки 18
2.6.Тестирование работы алгоритма 18
3. Реализация и анализ результатов 19
3.1. Язык программирования и среда разработки 19
3.2. Структура проекта программы 19
3.2.1. MakingTrainingSet 19
3.2.2. SentAnalysis 19
3.3. Точность и полнота классификации 22
3.4. Дальнейшие направления исследований 23
Заключение 24
Список источников 25



Download 172,46 Kb.

Do'stlaringiz bilan baham:
  1   2   3   4   5   6   7   8   9   ...   14




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©www.hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish