Automated Feature Engineering: Bridging the Gap between Feature Engineering and Self-optimization自动化特征工程:填补特征工程与自优化之间的空白

时间:2023-10-30         阅读:

光华讲坛——社会名流与企业家论坛第6628期

主题Automated Feature Engineering: Bridging the Gap between Feature Engineering and Self-optimization自动化特征工程:填补特征工程与自优化之间的空白

主讲人波特兰州立大学助理教授 刘鲲鹏

主持人bat365中文官网 黄雁勇教授

11月9日 15:00-16:00

举办地点:柳林校区诚正楼统计学院会议室

主办单位:数据科学与商业智能联合实验室 统计学院 科研处

主讲人简介:

刘鲲鹏是波特兰州立大学计算机系助理教授,研究兴趣为数据挖掘与强化学习。他最近的研究方向集中在自动化数据科学系统及其在大数据问题上的应用,包括智能城市、机器学习隐私保护、可解释的推荐系统、用户行为分析。他的研究成果发表在KDD、TKDE、IJCAI、AAAI、WWW等各个数据挖掘、机器学习的顶级会议、期刊上。多次担任IJCAI高级程序委员会委员,并且在KDD、ICML、ICLR、NeurIPS、AAAI、WWW、CIKM、ICDM等国际顶级会议中常态化担任程序委员会委员。

内容简介

In recent years, data mining has achieved great success in enormous scenarios. As the foundation of data mining, feature engineering plays an essential role in comprehending and perceiving data. Successful feature engineering can remove irrelevant features, generate informative features, improve model performance, enhance generalization, and provide better interpretation and explanation. However, not all researchers and practitioners are experts in feature engineering, making the automation of feature engineering an indispensable demand. In this talk, I will first introduce what feature engineering is and why it is difficult to automate the feature engineering process. Then, I will focus on (1) automated feature selection (2) automated feature generation. Finally, I will conclude the talk and present the big picture of developing intelligent, interpretable, and interactive automated data science systems.

近年来,数据挖掘已经在许多应用场景中取得了巨大的成功。作为数据挖掘的基础技术,特征工程在理解与感知数据的过程中有着不可替代的作用。理想的特征工程可以移除无关特征、生成信息量大的特征、提高模型表现、提高泛化性、提供更好的理解力和可解释性。但是,在诸多的应用场景中,大多数从业者并不是特征工程的专家,因此,自动化特征工程以降低特征工程的使用门槛,成为一个不可忽视的需求。在本次报告中,我将首先介绍自动化特征工程的重要性及其挑战性,并着重阐述:1.自动化特征选择;2.自动化特征生成。最后,我将展望未来的智能化、可理解、可交互的自动化数据科学系统并提出若干发展方向。

Baidu
sogou