主讲人简介:
刘伍颖,博士,教授,硕士生导师,山东省语言资源开发与应用重点实验室主任,教育部首批新文科研究与改革实践项目负责人,获得国家公派留学英国谢菲尔德大学,入选山东省高等学校青年创新团队发展计划带头人。本硕博毕业于国防科技大学计算机学院,曾是“天河”超级计算研究团队成员,具备坚实宽广的基础理论和系统深入的专业知识,致力于“多语种大数据语言资源”建设和“全语言深度信息处理技术”研究,开创“语言数据科学与技术”新文科探索与实践,具有长期的教学、科研和管理经验。已在SIGIR等会议和期刊上发表学术论文100余篇,出版学术著作4部,主持教育部人文社会科学研究规划基金、国家语委重点课题、广东省自然科学基金等科研项目10余项。建成产业级语言资源20余组,实现具备自主知识产权的软件系统10余套。相关语言资源和发明专利已在语言研究、计算传播、区域国别、网络空间安全等领域部署推广,实用效果理想,经济效益和社会效益显著。
内容提纲:
进入21世纪,随着计算技术的发展,人类语言数据生产力不断攀升。从语言学计算范式到数据密集范式的质变引发语言学“二次革命”,即语言数据革命。“二次革命”的缘起是21世纪语言研究面临语言数据巨量化、分析工具计算化、研究方法客观化和研究成果产业化的“四化”难题,而不断提升的图形处理单元算力、不断积累的语言大数据、不断改进的神经网络算法为“二次革命”备足了物质基础。在支撑“二次革命”的算力、数据、算法三要素中,语言数据这种新型生产要素成为了最活跃也是最关键的因素。以算力、数据和算法支持高水平科学研究、以高水平科学研究支撑产业应用、以科学研究和产业应用的创新成果推动“语言数据科学与技术”发展的新思路,成为语言学“二次革命”中有益的新文科探索与实践。