数据科学与人工智能:基于SQL和Python的数据挖掘、计算与分析研究【大学组】
开始日期: 2025-09-20
课时安排: 6周在线小组科研+5周论文指导
Prerequisites适合人群
适合年级 (Grade): 大学生及以上
适合专业 (Major): 对数据挖掘、人工智能、机器学习、深度学习、数据库及对相关专业感兴趣的大学生,建议具备Python基础
Instructor Introduction导师介绍
Y老师
香港科技大学终身正教授
香港科技大学
Y老师 终身正教授 博士生导师
杜克大学 博士
曾任AT&T实验室 研究员
入选ACM杰出科学家名单
研究方向:数据库理论与算法、数据安全和隐私
出版专著一本,在核心期刊发表论文百余篇。曾获ACMSIGMOD 最佳论文奖、ACM SIGMOD 最佳系统演示奖。研究成果见诸顶尖学术期刊及国际会议,如《Journal of the ACM》、《ACM Transactions on Database Systems》、《ACM SIGMOD/PODS Conference》,并担任美国计算机学会数据库系统汇刊和IEEE知识与数据工程汇刊的副主编。
Program Background项目背景
移动互联网和物联网飞速发展之后,大数据技术引发了全球范围内热烈的研究与应用热潮。大数据技术在众多领域中无处不在,例如商业决策优化、智能城市建设、精准医疗推行、金融风险防控、交通物流调度以及科研创新支持等。
Program Description项目介绍
本项目将介绍大数据技术的重要性与其该领域的最新科研进展。通过大数据分析、数据库结构与SQL操作等内容,为学员奠定坚实基础。课程还将深入探讨大数据计算系统的设计与实现,以及Spark编程与优化的技巧。此外,通过主题讨论,学员将了解Spark的实际应用、结构化数据处理,并展望数据科学的发展前景与动态。
Syllabus项目大纲
大数据简介、数据分析基础:简介大数据处理的挑战和方法、数据科学的数学基础;
数据预处理:清洗:缺失值处理(删除、填充等)、异常值检测与处理、重复数据删除等;集成:不同数据源的合并、实体识别、冗余属性处理等;转换:数据标准化、归一化、离散化、属性构造等;归约:数据归约的策略,如属性归约、数值归约等,以降低数据维度和规模
机器学习:机器学习基本概念、分类(监督学习、无监督学习、半监督学习、强化学习)及应用领域;决策树算法原理、构建、剪枝方法;逻辑回归的数学原理、模型训练方法(极大似然估计);神经网络基本结构(神经元、激活函数、多层感知网络)等,了解反向传播算法的原理;大模型简介
大数据计算:MapReduce:工作流程、核心思想和编程实现;Hadoop:各组件的功能和协同工作方式;Spark:概念、特点、架构;云计算:基本概念、服务模式、部署模式;
数据安全和隐私:数据匿名化技术:k-匿名、l-多样性等;差分隐私:定义、实现机制;数据加密技术、同态加密、TEE;多方安全计算:秘密共享、混淆电路;
项目答辩与点评
Program Outcome项目收获
6周【在线小组科研+全球就业力大师课】+5周论文指导,共126课时
1500字左右的项目报告
优秀学员获得主导师推荐信(8封网推)
项目结业证书
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导或者CNKI检索的英文普刊全文投递与发表指导
上一篇:港新又有新动作!26fall新开17个硕士专业,是“水项目”还是捡漏良机?
下一篇:返回列表
直接添加小助手阿星