(通讯员:周昊越)2026年6月4日下午,香港城市大学翻译及语言学系刘美君教授受邀到访公司,并在315报告厅为师生带来了一场题为《大语言模型在词汇语义研究上的应用》的学术讲座。
讲座伊始,刘美君教授结合自身多年的研究经验,向大家展示了传统语言学与大语言模型的融合路径。刘教授以“跪”“躺”“蹲”“飘”等汉语姿态动词为例,分享了团队的具体操作方法:首先依托大规模微博语料,为每个动词构建超万条不重复例句的数据库。随后,利用Llama、千问等开源大语言模型提取词向量。最后,通过CDPC等聚类分析技术,实现了对词汇不同语义类别的自动区分。
讲座中,刘教授详细展示了主成分分析(PCA)的结果。例如,“跪”字被清晰地划分出“连跪(游戏术语)”“跪了(表达折服)”“跪求(恳求)”以及表示程度的“笑跪了”等不同语义和语法类别。“躺”字则从“躺下”的物理动作演变为“躺赢”的隐喻用法。
在探讨词汇生命周期预测时,刘教授对比了SEIRS和Lag-Liama两种模型,并指出,尽管语言演变充满动态与不确定性,但SEIRS模型在预测词汇存活时长上相对更可靠。数据显示,“连跪”一词可能在未来十年内使用频次持续走低,而“跪了”“跪求”等用法则具有更持久的生命力。刘教授特别提及,人文社科研究者无需畏惧人工智能,也不必苦学编程代码。只需通过精准的自然语言指令,就能借助AI完成语料标注、词义整理等复杂工作。这一观点有效缓解了现场师生的技术焦虑。
在互动环节,刘教授耐心细致地解答了现场师生的提问。双方探讨热烈,学术氛围十分浓厚。
讲座尾声,杨志副经理对本次讲座进行了总结。他指出,大语言模型让词汇与语言学研究更具科学性,并鼓励老师们和同学们多接触、学习相关技术。
本场讲座兼具趣味性与前沿性,不仅为在场师生拓宽了语言学的研究思路,也为公司今后的课程教学与科研创新提供了宝贵借鉴。
审稿 杨志