时间:4月15日(周一)13:30-14:10
地点:仙林校区计算机学科楼327会议室
报告人:李延超
题目:面向标记不完全的弱监督学习算法研究
摘要:
随着多媒体技术与社交网络的迅速发展,每天都有海量的文本、图像、音频以及视频数据产生,其中大量的数据都是无标记的。从有限的带标记样本和大量的无标记样本中学习已经成为机器学习领域的重要研究话题。本报告针对主动学习算法基于单选择准则、模型或数据假设、噪声标签,以及选择样本冗余等问题,提出高效的主动学习算法;针对算法模型参数的敏感性问题,提出鲁棒的半监督学习算法;其核心思想是提高模型的性能,同时最大限度地减少人工获取标记数据的成本。报告内容主要包括新型直推学习模型、半监督流式模型、主动学习算法,以及弱监督学习原型系统的工具。本报告为解决数据流和数据过滤应用中标记样本不完全问题提供新的研究方法。面向标记不完全的弱监督学习算法将在计算机、生物学、医学、通信等领域以及金融、通讯等行业具有广泛的应用前景。
此外,报告还将展望两个研究方向:(1)利用大数据管理,研究资源(CPU、GPU、内存、硬盘、数据、标记数据等)受限情况下的智能学习算法;(2)开展结合“逻辑”的机器学习、探索大数据安全的算法研究。
报告人简介:
李延超,南京理工大学,计算机科学与工程学院硕博连读生,研究方向人工智能和大数据管理。在攻读博士期间发表IEEE Transactions on Knowledge and Data Engineering,Pattern Recognition,Knowledge-Based Systems,Journal of Parallel and Distributed Computing,Applied Intelligence期刊论文和ACM Conference on Management of Data (SIGMOD),IEEE International Conference on Bioinformatics and Biomedicine (BIBM)等会议论文共10篇,其中一作SCI论文4篇,EI国际会议1篇。2016年10月至2018年9月通过国家联合培养资助到英国爱丁堡大学(2019 QS Rank 18)联合培养,师从英国皇家学会院士、欧洲科学院院士、以及美国计算机协会会士Wenfei Fan,期间做了大数据管理和结合逻辑的机器学习项目,提出的理论和算法与华为和阿里巴巴合作并应用到蚂蚁金服信用欺诈的数据中。