Пятница, 27.12.2024, 18:10
Приветствую Вас, Гость Нашей Планеты

14:16
Не слишком ли сложно? Машинное обучение проверит, понятен ли текст аудитории
Методы машинного обучения (один из классов методов искусственного интеллекта) позволяют провести эффективный анализ любого текста по целому ряду критериев, например, по частоте встречаемости отдельных частей речи или по синтаксической сложности.

Как сообщает сообщает пресс-релиз Российского научного фонда., недавно международная группа учёных сравнила результаты применения этой технологии с результатами, полученными по формулам удобочитаемости. Отметим, что в основе таких формул лежат только два параметра: длина предложения и длина слова. Оказалось, что машинное обучение намного лучше показывает, будет ли понятен текст определённой целевой аудитории.

"[Нами] впервые предложен математически обоснованный и экспериментально проверенный метод оценки сложности текстов на русском языке, учебных материалов. Это может помочь в повышении уровня обучения в России, в её продвижении в международном рейтинге систем образования", – прокомментировал один из авторов статьи профессор Казанского федерального университета (КФУ) Валерий Соловьёв.

На сегодняшний день одним из самых популярных методов оценки сложности текста считаются индексы удобочитаемости. Последние помогают определить, насколько текст легко читать и, что самое важное, понимать.

Чаще всего используются индекс Флеша (FRE) и индекс Флеша–Кинкейда (FKG). Изначально они были созданы для английского языка, но впоследствии были адаптированы и для русского.

Такие индексы рассчитываются по формулам читаемости, но с их помощью можно изучить текст не более чем по двум критериям, таким как количество слов в предложении и количество слогов в слове.

Между тем двух критериев недостаточно для глубокого анализа текста, отмечают исследователи КФУ. Им вторят специалисты: удобочитаемость текста обеспечивается десятками параметров.

Учёные КФУ совместно с коллегами из Университета Иннополис и Национального политехнического института Мексики применили современные методы, позволяющие учесть гораздо большее количество параметров.

Специалисты выбрали школьные учебники по обществознанию для 5–11 классов, в которых отсутствовали картинки, таблицы и карты. (По этой причине их легче было использовать в работе.)

Все тексты разделили на группы, каждую из которых предстояло проанализировать по следующим критериям: количество слов в предложении, количество слогов в слове, частота встречаемости длинных слов, содержание различных частей речи, доля слов в именительном и родительном падеже и прочее.

В общей сложности учитывалось 11 параметров, которые так или иначе влияют на сложность восприятия текста. Так, чем меньше в тексте слов, состоящих из большого числа слогов, и чем больше глаголов, тем легче он будет читаться.

Анализ проводился при помощи сразу нескольких методов машинного обучения (речь идёт об автоматических способах решения каких-либо задач при помощи компьютера). При этом алгоритм не даётся заранее: программа ищет его сама на основе полученных данных.

В результате исследователи определили наиболее эффективный метод машинного обучения и подобрали необходимые для него настройки. Лучшие результаты для самых длинных текстов были получены при анализе полного набора признаков.

Таким способом можно будет в будущем оценивать академический текст по целому ряду критериев и делать более точные выводы о соответствии учебных материалов уровню восприятия учеников, нежели при использовании индексов удобочитаемости, считают специалисты.

Эксперты также сравнили результаты работы с данными других исследований, в которых оценивалась сложность текстов в тестовых пособиях по русскому языку как иностранному. Оказалось, что в этом случае уровень оценить гораздо проще именно при помощи машинного обучения. Возможно, это связано с тем, что сложность текста для русскоговорящего человека определяется не столько свойствами самого текста, сколько особенностями читающего, например, его словарным запасом.

В то же время иностранец, знающий язык на определённом уровне, будет более нуждаться в тексте, содержащем известные ему слова и грамматические конструкции.

Результаты научной работы опубликованы в издании Journal of Intelligent & Fuzzy Systems. Исследования поддержаны грантом Российского научного фонда.

К слову, ранее авторы проекта "Вести.Наука" (nauka.vesti.ru) рассказывали о других интересных исследованиях в этой области: почему чистота языка влияет на работу памяти и как лингвист определила разницу между языком и диалектом. Также мы писали о разработке технологии, позволяющей распознавать речь по губам лучше специалистов, а также о программе, которая понимает язык жестов.


Оцените материал:





ПОДЕЛИСЬ С ДРУЗЬЯМИ:

Материалы публикуемые на "НАШЕЙ ПЛАНЕТЕ" это интернет обзор российских и зарубежных средств массовой информации по теме сайта. Все статьи и видео представлены для ознакомления, анализа и обсуждения. Мнение администрации сайта и Ваше мнение, может частично или полностью не совпадать с мнениями авторов публикаций. Администрация не несет ответственности за достоверность и содержание материалов,которые добавляются пользователями в ленту новостей.


Категория: Общество | Источник: https://www.vesti.ru| Просмотров: 688 | Добавил: Pantera| | Теги: аудитории, текст, проверит, понятен, сложно?, Машинное, слишком, ли, не, обучение | Рейтинг: 3.0/1

В КОММЕНТАРИЯХ НЕДОПУСТИМА КРИТИКА САЙТА,АДМИНИСТРАТОРОВ,МОДЕРАТОРОВ и ПОЛЬЗОВАТЕЛЕЙ,КОТОРЫЕ ГОТОВЯТ ДЛЯ ВАС НОВОСТИ! УВАЖАЙТЕ ЧУЖОЙ ТРУД!
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

По этой теме смотрите:



ВСЕ НОВОСТИ:
Астрология, пророчества [1066]Астрономия и космос [1457]Безумный мир [2063]
Войны и конфликты [2310]Гипотезы и версии [3874]Дом,сад,кулинария [3945]
Животные и растения [2669]Здоровье,психология [4748]История и археология [4652]
Мир вокруг нас [2167]Мировые новости [7583]Наука и технологии [890]
Непознанное [4196]НЛО,уфология [1263]Общество [7795]
Прогнозы ученых,исследования [798]Происшествия,чп,аварии [1302]Российские новости [5860]
Стихия,экология,климат [2739]Феномены и аномалии [945]Фильмы и видео [6336]
Частное мнение [4911]Это интересно! [3311]Юмор,афоризмы,притчи [2394]



АРХИВ САЙТА:
Астрология и пророчества [825]Гипотезы и прогнозы [4629]Дом,сад,кулинария [223]
Животные и растения [2796]Здоровье и красота [5708]Интересности и юмор [3758]
История и археология [4696]Космос, астрономия [2263]Мир вокруг нас [1982]
Наука и технологии [2422]Непознанное [3983]НЛО,уфология [1747]
Общество, в мире, новости [11574]Психология и отношения [84]Стихия, климат, экология [421]
Фильмы и видео [367]Частное мнения [111]Эзотерика и феномены [2031]