您当前的位置: 首页 > 留学资讯

数据科学与人工智能:基于SQL和Python的数据挖掘、计算与分析研究

数据科学与人工智能:基于SQL和Python的数据挖掘、计算与分析研究

开始日期: 2026-05-16

课时安排: 6周在线小组科研+5周论文指导

Prerequisites适合人群

适合年级 (Grade): 大学生及以上

适合专业 (Major): 对数据挖掘、人工智能、机器学习、深度学习、数据库及对相关专业感兴趣的大学生,建议具备Python基础

Instructor Introduction导师介绍

K老师

香港科技大学终身正教授

香港科技大学  

K老师  终身正教授  博士生导师

U.S. News美国Top10大学 博士

入选ACM杰出科学家名单

研究方向:数据库理论与算法、数据安全和隐私

在核心期刊发表论文百余篇。曾获数据库领域国际顶级会议最佳论文奖、最佳系统演示奖。研究成果见诸顶尖学术期刊及国际会议,并担任美国计算机学会汇刊和IEEE汇刊的副主编。

Program Background项目背景

Hadoop和Spark是当前处理大数据计算问题应用最为广泛的系统及编程框架,具有快速、通用、鲁棒、分布式等特点,支持多种编程语言和数据源,并提供多个可扩展的组件库如机器学习、图处理、流处理等。

Program Description项目介绍

本课程将通过大量实例让学生对Hadoop及Spark有充分了解,并能够动手编写程序,为未来面向大数据的科研工作打下良好基础。

Syllabus项目大纲

MapReduce and Hadoop:简介大数据处理的挑战和方法、介绍MapReduce编程模型、介绍Hadoop生态系统的基本概念和架构

Spark基础与RDD:介绍Spark的概念和特点、深入研究弹性分布式数据集(RDD)的概念和原理、学习如何使用Spark进行数据处理和转换操作、实践编写基于RDD的Spark应用程序

SparkSQL和MLlib:介绍SparkSQL的基本概念和功能、学习如何使用SparkSQL进行数据查询和分析、探索Spark的机器学习库(MLlib)的功能和使用方法、实践构建和训练Spark的机器学习模型

大数据系统的算法设计:学习大数据系统中的算法设计方法、探讨分布式算法设计的最佳实践、实践运用算法设计解决实际大数据问题

GraphX/GraphFrames:介绍图数据处理的基本概念和应用场景、学习使用Spark的图处理库GraphX/GraphFrames进行图计算和分析、探索图算法的实现和优化策略、实践构建和分析大规模图数据

项目答辩与点评

Program Outcome项目收获

6周【在线小组科研+全球就业力大师课】+5周论文指导,共126课时

1500字左右的项目报告

优秀学员获得主导师推荐信(8封网推)

项目结业证书

EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导或者CNKI检索的英文普刊全文投递与发表指导

上一篇:EE电子工程:探索智能科技的“心脏” 人工智能芯片设计研究

下一篇:返回列表

最新留学资讯更多

直接添加小助手阿星

微信号:nan2xing
关于我们

南星教育成都锦途教育信息咨询有限公司旗下品牌南星教育,专注香港、新加坡、日本、 美国、英国、澳达利亚等地区/国家的硕士、 本科申请,历经十余年,业务专业,风格诚恳。

业务范围 :留学申请|语言培训 |名校游学
联系我们
  • 地址: 成都市一环路东一段159号电子信息产业大厦1楼114, 电子科技大学(沙河校区)旁100米。

  • 电话: 028-83206677 微信: nan2xing

  • 地址: 四川省成都市郫都区高新区合作路89号 龙湖时代天街29栋402。

  • 电话: 028-64724052

微信公众号 关注领取语言大礼包