日前,第17届IEEE ISI会议在深圳落幕。本次会议开启前,IEEE特别发起了国际大数据分析竞赛(IEEE ISI World Cup 2019),来自来自中国、美国、巴基斯坦、英国、德国等7个国家的企业、高校共363支队伍,1001名选手参战,金山AI Lab团队以大比分优势在Mission 2比赛中夺得冠军,应邀参加了如期举行的国际会议。
IEEE ISI是安全信息学领域的旗舰会议,于2003年首次在美国亚利桑那州图森市召开,该会议旨在促进人工智能赋能的解析学技术(AI-Enabled Analytics)的产业落地,并为全球学术界和产业界同行提供一个学术交流与技术探讨的平台。
基于3500家上市公司全量信息,ISI World Cup 2019国际大数据分析竞赛将这些上市公司在财务、法务、股权、经营状况、舆论等方面的文本信息作为训练数据,参赛选手需要合理运用现有数据集材料,筛选出对竞赛有价值的信息进行特征构建和模型训练。该赛事由两大任务(Mission)组成,分别进行竞赛和评比,M1是企业投资价值评估,M2是法律诉讼类型预测。
金山AI Lab派出两支团队分别参加两个任务,一支队伍在M2中以44分夺得冠军,分数比其他队伍高了接近一倍,达到了参赛队伍中的领先水平,可以在生产环境中直接应用,解决企业痛点。在M2上面,金山AI Lab使用了递进优化的策略,对数据进行多层次的分类,避免了数据分布因极度不均衡而带来的训练失效问题。另一支队伍在M1中取得第五名。此次金山AI Lab的两支参赛队伍双双获奖,展示了其在大数据分析方面的团队实力与创新潜能。
在互联网飞速发展的当下,大数据正深刻改变着人们的思维方式、生产方式和生活方式,已成为推动人类社会加速步入智能化时代的关键资源。毋庸置疑,大数据将掀起新一轮的产业和技术革命。随着大数据兴起的数据挖掘、机器学习和人工智能等相关技术,或将改变数据世界里的很多算法和基础理论,实现科学技术上的突破,给各行业的产业链带来难以想象的巨大变化,创造出意想不到的商业价值。
目前,大数据已成为各大企业发展的重点,金山AI Lab就是在这一背景下成立的。目前,金山AI Lab以NLP为核心,涵盖图像、文本、语音三大方向,主要研究内容分为知识图谱、机器翻译、内容推荐和智能校对等。研究项目主要分为两类,一类是专注于落地的项目,如机器翻译、智能校对等;另一类是专注于基础服务的项目,例如知识图谱,可以对这些直接落地的项目提供长期的辅助研究。