14:00-14:30
标题:改变我们的文风——战后报刊语言句子复杂度和隐喻使用的变迁
摘要:文风的改善乃至整顿是我国现代历史上发生过的多次的重要语言运动。本报告将介绍我们在二战结束后基于人民日报数据的建设,和基于此对文风的两个重要指标,隐喻和句子复杂度进行的计算工作。自二战后,报刊数据呈现出了隐喻军事化和工业化的特性,而句长的则呈现“两边高中间低的”变化趋势。
个人简介:饶高琦,北京语言大学汉语国际教育研究院助理研究员,语言智能研究院、中国语言规范与标准研究中心兼职研究员。文学博士,研究兴趣为语言资源建设、句法语义分析、数字人文。在国内外会议期刊发表论文二十余篇。
14:30-15:00
摘要:本报告将介绍基于多任务联合学习的古籍文本信息标注系统。应用相关技术,不仅可对文献进行自动标点,提升古籍整理效率,还可自动识别文献中的人名、地名、时间名等信息,从而有效地辅助研究者在浩如烟海的文献中发现有效信息,探索新问题。本报告将分享两则研究案例:(1)以130种清代文评专书文献为例,统计宋代作家苏辙在清代文学批评语境中的地位变迁,并探寻其背后的文学与历史原因。(2)以《畿辅通志》为例,呈现命名实体识别技术对于快速提取史料信息的作用,进而探寻编者李卫的编纂心态。
个人简介:
诸雨辰,北京人,文学博士,北京师范大学文学院讲师。研究兴趣为清代文学理论、数字人文。著有《弘道以文:文评专书与清代散文批评研究》,整理有《梦溪笔谈》译注、《聊斋志异》选读等。
胡韧奋,安徽宣城人,北京师范大学中文信息处理研究所、汉语文化学院讲师,中文信息学会青工委成员,研究方向为计算语言学、古汉语信息处理、计算机辅助语言教学等,主持国家社科基金和国家自科基金青年项目等多项课题,在国内外高水平会议期刊上发表论文二十余篇。
15:00-15:30
标题:唐诗三百首的语料库构建与意象标注
摘要:以唐诗三百首语料库为例,介绍古文词法分析(分词、词性标注)和意象、情感的标注工作,讨论诗词的韵律、主题、意象的深入挖掘存在的诸多难题。
个人简介:
李斌,南京师范大学文学院语言科技系副教授。2009年在文学院计算语言学方向博士毕业留校后,讲授中文信息处理概论、数据库、语法学、数理逻辑等研究生和本科课程。2010-2013年南京大学计算机系在职博士后,2015年美国布兰迪斯大学中文信息处理方向访问学者、2019年哈佛大学数字人文方向访问学者。研究领域包括计算语言学和数字人文,特别是古汉语信息处理等方面。在古籍断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等方面做出了诸多研究成果,多种语料库在国际LDC平台发布,是国际古代语言信息处理会议程序委员会委员。出版专著《语言探秘》等3部,发表论文70多篇。主持完成国家社会科学基金青年项目1项、教育部社科青年项目1项。目前主持国家社科基金项目1项。
摘要:古今中外,性别既是人们茶余饭后热衷讨论的话题,又是学术研究永恒的课题。在计算机技术飞速发展的今天,利用数字手段研究性别问题,特别是性别偏见与性别平等已是学术界新兴的热门。本报告将分享利用语料库,以职业名词和形容人的形容词为例,探究汉语语言中的性别角色随时间的变化。研究发现,从新中国成立到现在,纸质媒体使用的语言呈现从男性化到中性化的趋势。
刘鹏远,博士,北京语言大学信息科学学院副研究员。研究方向为自然语言处理、语言资源建设、语料库语言学、数字人文等。主持/完成国家自然科学基金,北京市自然科学基金,教育部人文社科基金等多项,在国内外会议期刊发表论文50余篇。
朱述承:准博士生,北京语言大学硕士在读,在读期间在国内外会议发表论文3篇。研究方向为语料库语言学、语言与性别、计量语言学、教育测量等。
16:00-16:30
摘要:道德观是人类价值观的重要组成部分。能够对发生的事情做出道德判断,是人类智慧独特的、普遍具有的能力。随着人工智能的日益广泛应用,智能机器是否可以通过学习人类的道德规则,模仿人类进行道德倾向性判断,进而做出符合人类道德观的行为决策,成为人工智能伦理领域需要解决的问题。
道德的倾向性与所处人文社会环境、历史时期均有关联。本报告中,我们详细介绍道德观的基本理论以及目前道德倾向性判断的研究进展。在此基础上,介绍近期我们对适合中国人文社会环境的道德倾向性计算问题的思考和探索。
于东,博士,北京语言大学信息科学学院副教授。研究方向为自然语言处理、语言资源建设。近年来深入研究语义推理、常识计算等相关问题。主持国家自然科学基金,教育部人文社科基金等项目,在国内外会议期刊发表论文30余篇。
今日责编:苹果你往上飞
原文始发于微信公众号(汉语堂):历史、性别与道德:数字人文沙龙2020|中文信息学会青工委