来源:大数据商业分析研究平 编辑:宣传信息事务办公室 发布时间:2019-07-16
2019年7月3日,中国人民大学商学院大数据商业分析研究平台在明德商学楼举办明商云智学术系列讲座第八讲。
北京大学外国语学院外国语言学及应用语言学研究所、北京大学信息科学技术学院计算语言学研究所双聘副教授、博士生导师苏祺应邀做了“Python文本数据分析与自然语言处理应用”的主题报告。人大商学院会计系吴武清副教授主持讲座,财务与金融系李焰教授、会计系系主任张敏教授等学院师生共40余人全程参与讲座。
作为语言学和计算机科学领域专家,苏祺副教授在上午环节介绍了自然语言处理相关理论基础,包括机器学习与深度学习技术,以及相关技术在金融文本挖掘实践中的应用等。下午的讲座内容则聚焦如何对商业文本数据进行操作、统计及可视化处理,以及文本分析中常用的Python库、技术和方法。
苏祺副教授
苏祺副教授以谷歌流感趋势、利用推特数据预测美国总统大选结果为例,令参会者领略了数据分析的魅力。她还介绍了实体识别、关系抽取等信息抽取的相关技术,并以谷歌搜索为例介绍知识图谱、以AI机器人诗歌创作为例介绍了文本生成,展示了信息数据抽取和转化的现实意义。关于自然语言的处理与应用,苏祺副教授利用机器学习和深度学习的方法,通过主题模型、语言模型等经典模型,对语言特征进行提取与整合、进行数据训练和学习,最终实现对语言的模拟和预测。最后,她使用Python进行语言处理操作,详细演示了操作过程,并回答相关问题。
整场讲座内容妙趣横生又富含科学性,令参会师生感受了数据分析的魅力,并对在未来研究中掌握和改善对于文本分析方法的使用颇有益处。
人大商学院新闻网版权与免责声明:
① 凡本网未注明其他出处的作品,版权均属于人大商学院,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:人大商学院”。违反上述声明者,本网将追究其相关责任。
② 凡本网注明其他来源的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网对其负责。
③ 有关作品内容、版权和其它问题请与本网联系。
※ 联系方式:中国人民大学商学院宣传信息事务办公室 邮箱:media@rmbs.ruc.edu.cn