期刊会议

您现在的位置: 首页 -> 期刊会议 -> 暑期学校 -> 正文

暑期学校

2019年浪潮铸远第六届“大数据与商务分析”国际暑期学校简报(三)

来源:学工办 作者: 发布时间:2019-07-25 09:12:00 点击数:

【迎哈工大百年校庆系列活动】

2019年“大数据与商务分析”国际暑期学校

动态全览

期数:第三期                                                                     2019725

———————————————————————————————————————————————

★每期快讯:

蔡天文教授作“大数据分析和集成学习”专题报告

    724日,美国宾夕法尼亚大学沃顿商学院蔡天文教授为学员们讲授大数据分析和集成学习的内容。

    蔡天文首先介绍了大数据给各行各业带来的变革,比如投资、体育、围棋等领域。甚至大数据还可以预测文学、艺术和电影的市场,影响文艺创作。他指出,大数据应用于医疗领域对于人类具有重大意义。大数据分析可以根据病人的数据选择最合理的个性化治疗方案,促进医疗领域的“阿尔法狗”的发展。当然,大数据分析的发展也面临着各种问题和挑战,比如隐私问题、分布式统计推断,但最大的问题还是数据分析人才紧缺。

    关于集成学习,蔡天文指出任何一种单一方法都存在局限性,而且从概率上解释了为什么集体的智慧要大于个人。他详细介绍了决策树和随机森林的原理和使用方法。通过通俗易懂的案例和比喻清晰地阐述了装袋法和随机森林的优点。为了突破装袋方法的局限性,即所有的分类器可能会在同一个区域内获得错误的分类结果。推进和自适应提升通过迭代和串行的方法,将多个弱学习器进行融合,从而提高整体的分类准确率。

    最后,蔡天文总结到大数据和机器学习等技术的进步将会为人类社会带来巨大的发展,但同时也应该重视可能存在的问题。

———————————————————————————————————————————————

★人物风采:

授课教师

蔡天文

美国宾夕法尼亚大学,讲席教授,副院长

Journal of the Royal Statistical Society

期刊副主编

志愿者之星:张婉莹

    感谢学院对我的信任,把暑期学校班级助理的职位交给我做;感谢宿舍一班同学们对我的支持,我工作的顺利进行离不开班级每一个人的配合与理解,尤其感动班级里热心同学的积极帮助,谢谢你们!志愿者的工作多且杂,庆幸的是我的小班至今一切顺利,但有时也会因为自己考虑不周而感到惭愧。开心的是每天晚上睡觉之前,当我刷到同学们说来到暑期学校有收获时,就会感觉特别棒。我想以后我可以骄傲的说一句,第六届HIT大数据暑期学校,我也贡献了自己的一份小力量!愿,接下来的几天,一切顺利。也愿,每一个人都能不虚此行,友谊长存!

———————————————————————————————————————————————

★学员感言:

    今年有幸参加了哈尔滨工业大学经济与管理学院举办的“大数据与商务分析”暑期学校,深受启发,受益匪浅。首先是强大的师资阵容。授课教师要么是美国宾夕法尼亚大学、纽约大学、亚利桑那大学等知名高校的资深学者,要么是国内长江学者、杰出青年基金获得者,这些老师学术造诣深厚,上课内容深入浅出,讲课风格引人入胜,我不仅学习到了大数据、人工智能、营销、电商相关专业知识,还学习了他们的治学态度和授课艺术。其次,学者们讲授了大数据、数据科学、人工智能的前沿方法,以及在健康、金融、社会媒体、营销等领域的最新应用,开阔了视野,对相关领域国际学术前沿和商业社会实践有了更清晰的认识。非常感谢学者们在百忙之中能抽出时间为大家授课。

    此外,这次组织会议的哈工大老师和同学认真负责,态度热情,为参加暑期学校的老师和同学提供了周到的服务和便利的安排,非常感谢他们!根据我过去组织学术会议的经验,邀请如此众多的国内外知名度学者到哈工大,安排200多学员的教学和生活,事务繁杂,非常不容易,在此向所有负责此次暑期学校的哈工大领导、老师和同学表示诚挚的谢意!

——钟帅(贵州财经大学)

    对于今天蔡老师所讲的关于集成森林对处理缺失值,且不会出现过拟合有很大作用,虽然我们也可以通过多重线性回归得到一定解决,但能从开头就避免问题则更佳。决策树对于我现在研究的推荐系统确实提供了一个思路,找到其用户的特征属性,对其进行划分,以此一步步推进,得出最终是否推荐这一结果,与我在推荐系统中现在用的聚类不同,之后可以尝试一下决策树,再讨论是否可以用集成森林。

    还有对于昨天讲解的关于轨迹推荐,很是惊讶,之前从未思考过有这样的一种推荐方式,基于位置的推荐方式倒是早已普遍,但对于怎么实现轨迹推送,还需要之后好好回校研究。感谢哈工大给予的此次学习机会!

——邓奥(湖南工商大学)

    今天宾夕法尼亚大学蔡天文教授的讲座让我受益匪浅,他首先概述了目前的大形势,介绍了大数据在金融投资、精准医疗、预防犯罪、投票竞选等方面的应用,又着重讲解了决策树、集成学习的三种方式,引领机器学习前沿。讲座结束后,同学们积极提问,氛围热烈,蔡教授最后讲到,希望我们不要成为盲目的淘金者,不要迷失在利用已有模型中,而是要真正学习其原理,切实提高自己能力。感谢哈工大暑期学校让我拥有此次学习机会,开阔了我的视野,使我深入了解大数据,明确今后的科研方向。

——董抒凝(东华大学)

    今天听过蔡教授的讲授的BigData revolution: opportunities and challenges,对我这样的大二学生很有帮助。对于我们来讲,面对着大数据时代逼近、交融的的步伐,如何让自己具备在技术上的思考和技能成为我们前进和转折的契机,是我们需要仔细考虑的问题。今天蔡教授讲授的通过决策树的方式对数据进行分类和预测的方式结合上实际的例子,理解起来较为简单。讲座结束后有人问了一个方法论和方法本身的问题,我觉得还是挺值的思考的。如今的信息社会,我们身边很大一部分的数据、信息大厦,都是构建在统计的地基之上,big datahistory data,为我们提供了洞见未来世界的一扇大门,商家、政府、金融机构、医院,甚至消费者,都想通过统计和数据的大门去窥见未来的模样。毫无疑问,随着技术的发展和进步,我们对于未来的预测和洞见肯定会愈发的精准,在这样的big context之下,统计学家、技术工作者也需要考虑技术应用的社会影响,由技术、方法加剧的信息不对称和技术方法崇拜的问题,以及这些问题对于人类现有的道德体系、规范体系带来的冲击值得我们思索和警惕,让技术发挥技术的价值、人发挥人的作用。

——谢宝庆(北京科技大学)

    之前有浅显的学习过模式识别和人工智能,好久没有回顾,今天对于机器学习的讲解让我获益匪浅。三者都是要对样本数据进行训练,得到一些规则,再根据输入的数据预测输出结果。之前对于人工智能的学习主要学习了一些分类算法,二分多分等等,但对于决策树的了解不多。今天学习了一些关于决策树以及随机森林的知识。首先,明确希望分类后的样本纯度越高越好。如果要产生尽量多的样本,要考虑到各个分类节点的权重,这种方法要优于平均值的方法。随即森林即集成学习需要建立多个独立的分类器,集成汇总结果。可以用不同的算法来生成不同决策树(分类器)或者根据不同的特征来分类。精确的决策树权重要比不精确的决策树权重大。通过随机采样,得到多个样本集,分别独立的训练出多个决策树,通过集合策略来得到最终的输出。

——杜怡飞(哈尔滨理工大学)

    724日,蔡天文教授以Big Data Analytics for Busines: Methods and Applications为题作了为期一天的报告。蔡教授从大数据的发展以及可能对未来各行业的影响出发,阐述了大数据的重要性以及数据科学相关人才的紧缺。机器学习是人工智能的核心,蔡教授细心地讲解了决策树的原理,进而深入解释了集成学习中的Random ForestAdaboost方法,详细解释了算法的原理以及各个算法的优劣势,以具体的例子来解释算法,讲授通俗易懂,学生反映热烈。

——管梦城(华中科技大学)

    今天是在暑期学习的第三天,我已经开始慢慢习惯了在哈工大的住宿生活。每天早起从宿舍出发,随着慢慢习惯原来觉得好像要走上半小时的路程也在一天天慢慢缩短。

    今天是来自全球知名的沃顿商学院的蔡教授的有关机器学习以及集成算法相关主题的讲座。上午蔡教授介绍了大数据背景下的机器学习在将来生活中各方面的发展及应用。尤其突出了跟国民生活息息相关的建立在数据分析上的精准医疗应用。同时还介绍了机器学习最基础的决策树算法。下午学习了集成算法中基本且重要的BaggingRandom Forest以及Boosting算法,蔡教授像我们展示了如何应用这几种算法以及算法各种优缺点。使我进一步加深了对机器学习的理解。

    经过三天的学习,拓展了我在大数据应用方面的视野,了解了大数据商务分析的研究前沿。同时也启发了我大数据分析的更多研究发展方向,受益匪浅,更加期待接下来四天的课程,希望能收获更多。

——王一粟(中国人民大学)

———————————————————————————————————————————————

★精彩瞬间:

蔡天文教授

讲座现场

———————————————————————————————————————————————

2019年浪潮铸远第六届“大数据与商务分析”国际暑期学校动态简报

主编:曹文涛

副主编:李哲、韩雪

编委:惠娴斐、兰婷、张婉莹、李晨、李斌、邓旭东、陈珏涵、辛建轩