Iris Hu Profile Photo
胡韧奋
副教授、硕士生导师
研究方向:计算语言学
Email: irishu@mail.bnu.edu.cn

News & Updates|课题组新闻


个人简介

研究兴趣

近年来,语言智能技术日新月异,我很庆幸生活在这样一个充满机遇和挑战的时代。结合专业和兴趣,我希望探索语言学和智能技术紧密融合的计算语言学研究,例如: (1) 以语言学知识为指导,设计语言分析算法和语言资源,以服务于AI模型的的评测、改进和可解释性研究; (2) 以智能技术助力语言学研究,对大规模语言数据进行深层次语义分析,从而实现语言现象的系统描写和语言规律的挖掘; (3) 计算语言学方法在语言教学、古籍整理、医疗与健康等领域的应用。

教育背景

讲授课程

研究成果

1. 代表性论文(*标记通讯作者)
2. 发明专利(已授权)

开源项目·工具应用

Chinese Word Vectors
https://github.com/Embedding/Chinese-Word-Vectors
该项目覆盖上百种中文语言向量资源,在Github已获得超过12000星。

“AI太炎”古汉语大语言模型
http://taiyan.shenshen.wiki
支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务。

古汉语自动句读标点和专名识别
https://seg.shenshen.wiki
该系统曾获CCL 2020“古联杯”古籍文献命名实体识别评测大赛一等奖。

英文历时词义演变数据及可视化工具
https://github.com/iris2hu/diachronic-sense-modeling
该项目开源了近200年(1810-2009)3220个英文多义词词义历时演变数据及可视化方法。

CCA中文搭配助手
http://cca.irishu.cn
该项目提供了中文搭配知识查询网站、中文搭配分析器及开源的中文搭配知识库。其中,中文搭配分析器支持句法搭配自动抽取和25项句法复杂度指标测量。

CLRA中文词汇特征分析器
https://github.com/whynot777/CLRA-doc
该工具参考《国际中文教育中文水平等级标准》《义务教育常用词表(草案)》,支持文本标注(分词、词性、词语等级)和词表生成,提供词汇复杂度、词汇多样性、词汇密度和词汇长度等四个维度共60余项词汇丰富性指标的自动分析。

L2C-Cohesion汉语语篇衔接特征自动分析工具
https://github.com/mybluue/l2c-cohesion
该工具支持词汇、语法和话题三个层面的语篇衔接特征分析和27项相关指标计算。

L2C-rater汉语二语作文自动评分工具
https://l2c.shenshen.wiki/

京师汉语·词汇自适应测试平台
http://hanyu.ironpy.cn/hy/anon/index