胡韧奋  博士

北京师范大学国际中文教育学院
副教授、硕士生导师

研究方向:计算语言学

Email: irishu@mail.bnu.edu.cn

Google Scholar    Github    English Version


News


个人简介

研究兴趣

近年来,语言智能技术日新月异,我很庆幸生活在这样一个充满机遇和挑战的时代。结合专业和兴趣,我希望探索语言学和智能技术紧密融合的计算语言学研究,例如: (1) 以语言学知识为指导,设计语言分析算法和语言资源,以服务于AI模型的的评测、改进和可解释性研究; (2) 以智能技术助力语言学研究,对大规模语言数据进行深层次语义分析,从而实现语言现象的系统描写和语言规律的挖掘; (3) 计算语言学方法在语言教学、古籍整理、社会计算等领域的应用。

教育背景

讲授课程

科研项目

1. 主持人 2. 核心成员

研究成果

1. 代表性论文(*标记通讯作者)
2. 发明专利(已授权)

开源项目·工具应用

Chinese Word Vectors
https://github.com/Embedding/Chinese-Word-Vectors
该项目覆盖上百种中文语言向量资源,在Github已获得超过11000星。

“AI太炎”古汉语大语言模型
https://t.shenshen.wiki
支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务。

古汉语自动句读标点和专名识别
https://seg.shenshen.wiki
该系统曾获CCL 2020“古联杯”古籍文献命名实体识别评测大赛一等奖。

古汉语词义标注语料库
https://github.com/iris2hu/ancient_chinese_sense_annotation
该项目开源了古汉语词义级别的精加工知识库和语料库。

英文历时词义演变数据及可视化工具
https://github.com/iris2hu/diachronic-sense-modeling
该项目开源了近200年(1810-2009)3220个英文多义词词义历时演变数据及可视化方法。

L2C-rater汉语二语作文自动评分工具
https://l2c.shenshen.wiki/

京师汉语·词汇自适应测试平台
http://hanyu.ironpy.cn/hy/anon/index

基于搭配的句法复杂度抽取工具(Python based)
https://github.com/iris2hu/Chinese-collocation-complexity

融合词义信息的词汇复杂度抽取工具(Python based)
https://github.com/iris2hu/sense-aware-lexical-sophistication

唐诗别苑:基于知识图谱的全唐诗语义检索与可视化平台
http://aied.bnu.edu.cn/poem

诗词别苑竞技闯关游戏(微信小程序)