17.07.2025
30
A STUDY ON THE CULTURAL CLASSIFICATION OF KOREAN IDIOMATIC EXPRESSIONS -WITH MACHINE LEARNING ENHANCEMENTS

Автор: In Sook, Jeong

Аннотация: В данном исследовании предлагается семикодовая система классификации корейских идиом по культурным темам. Корпус из 5 миллионов токенов был проанализирован с помощью TextRank, и 800 идиом были вручную размечены для обучения многомаркерного классификатора на базе BERT (F1 = 0,87). Для поддержки методов обучения, связывающих изучение идиом с культурной грамотностью, были отобраны 100 наиболее часто встречающихся идиом.

Ключевые слова: Корейские идиомы; культурные коды; машинное обучение; BERT; TextRank; обучение корейскому языку

Страницы в журнале: 13 - 20

Скачать