各学院、有关部门:
安徽省大数据与人工智能应用竞赛是由安徽省教育厅主办的一项致力于提高老员工的大数据与人工智能的创新创业能力,以适应大数据与人工智能技术应用领域快速增长的人才需求的学科竞赛。自2021年起,该赛事的大数据方向独立设置为安徽省大数据应用竞赛。
为推动公司大数据相关专业的专业建设,培养员工的数据科学思维、实践能力和协作能力,特举办安徽省大数据应用竞赛赛前培训,现将报名及培训有关事项通知如下:
一、报名范围:
公司在籍在校本科生。
二、报名方式:
参赛同学于2021 年4月5日18:00前通过竞赛QQ 群在线填写《竞赛报名表》(QQ 群:723927285)
三、赛前培训:
本次赛前培训由安徽兰智大数据科技有限公司提供技术支持,具体的培训日程及内容安排如下:
课程内容零:实验环境准备, 时间4月7日晚上6:30-9:30
所需知识储备 |
Windows操作系统、Linux操作系统、大数据处理架构Hadoop的关键技术及其基本原理、列族数据库HBase概念及其原理、数据仓库概念与原理、关系型数据库概念与原理 |
训练技能 |
双操作系统安装、虚拟机安装、Linux基本操作、Hadoop安装、HBase安装、Sqoop安装、idea安装 |
任务清单 |
1. 安装Linux系统;2. 安装Hadoop;3. 安装MySQL;4. 安装HBase;5. 安装Hive;6. 安装Sqoop;7. 安装Python;8. 安装idea |
课程内容一:本地数据集上传到数据仓库Hive,时间4月14日晚上6:30-9:30
所需知识储备 |
Linux系统基本命令、Hadoop项目结构、分布式文件系统HDFS概念及其基本原理、数据仓库概念及其基本原理、数据仓库Hive概念及其基本原理、mapreduece,写代码 |
训练技能 |
Hadoop的安装与基本操作、HDFS的基本操作、Linux的安装与基本操作、数据仓库Hive的安装与基本操作、基本的数据预处理方法 |
任务清单 |
1. 安装Linux系统;2. 数据集下载与查看;3. 数据集预处理;4. 把数据集导入分布式文件系统HDFS中;5. 在数据仓库Hive上创建数据库 |
课程内容二:Hive数据分析, 时间4月21日晚上6:30-9:30
所需知识储备 |
数据仓库Hive概念及其基本原理、SQL语句、数据库查询分析 |
训练技能 |
数据仓库Hive基本操作、创建数据库和表、使用SQL语句进行查询分析 |
任务清单 |
1. 启动Hadoop和Hive;2. 创建数据库和表;3. 简单查询分析;4. 查询条数统计分析;5. 关键字条件查询分析;6. 根据用户行为分析;7. 用户实时查询分析 |
课程内容三:Hive、MySQL、HBase数据互导, 时间4月27日晚上6:30-9:30
所需知识储备 |
数据仓库Hive概念与基本原理、关系数据库概念与基本原理、SQL语句、列族数据库HBase概念与基本原理 |
训练技能 |
数据仓库Hive的基本操作、关系数据库MySQL的基本操作、Sqoop工具的使用方法、HBase API的Java编程、ideae开发工具使用方法 |
任务清单 |
1. Hive预操作;2. 使用Sqoop将数据从Hive导入MySQL;3. 使用Sqoop将数据从MySQL导入HBase;4. 使用HBase Java API把数据从本地导入到HBase中 |
课程内容四:利用Python进行数据可视化分析, 时间5月5日晚上7:00-10:00
所需知识储备 |
数据可视化、Python语言 |
训练技能 |
利用Python语言对MySQL数据库中的数据进行数据可视化分析、Python的安装、相关可视化依赖包的安装与使用、各种可视化图表生成方法 |
任务清单 |
安装python、安装可视化依赖包、柱状图可视化分析、散点图可视化分析、地图可视化分析 |
具体培训地点待报名截止后另行通知,如有疑问,请加群咨询。对大数据感兴趣的师生均可加入。联系人:杨老师(18726016048)
数理科学与工程学院
2021 年3 月25 日