方案简介

针对大数据专业建设的三大难题,富秀大数据为各大高校量身定制了大数据的教学科研平台——大数据云教学平台。大数据云教学平台通过应用容器技术,以少量机器虚拟大量实验集群,可供大量学生同时拥有多套集群进行试验,而每个学生的实验环境不仅相互隔离,方便高效地完成实验,而且实验彼此不干扰,即使某个实验环境被破坏,对其他人也没有影响,一键重启就可以拥有一套新集群,大幅度节省了硬件和人员管理的投入成本。
简单
无需复杂网络配置
便捷
一键搭建、销毁集群
自动
提供自动化部署

方案服务对象

提供数据分析的实验平台,提供学习行业知识平台,提供师资培训,提供大数据实践平台
企业
全面的数据分析
老师
师资力量培训
学生
实践应用平台

智能实验系统

HDFS集群、Zookeeper、Hive集群

内置Hadoop分布式文件系统(HDFS),能提供较高吞吐量的数据访问,非常适合大规模数据集上的应用,可以用于针对HDFS的所有特点的实验和操作。是一个为分布式应用提供一致性服务的软件,提供配置维护、名字服务、分布式同步、组服务等。 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能, 可以将sql语句转换为MapReduce任务进行运行。
HDFS
HDFS分布式系统基础架构
YARN
分布式应用程序协调服务
Hive
基于Hadoop的数据仓库

Spark集群、HBase集群、交通大数据

建立在HDFS之上的新一代计算框架,包括 Spark SQL、SparkStream、Spark ML等。HBase是一个分布式的、面向列的开源数据库, 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,HBase基于列的而不是基于行的模式。基于MapReduce思想,编写车牌识别程序。实现对江苏某两处监控图片中的车牌的识别,统计。
Spark
大规模数据处理计算引擎
HBase
分布式、面向列数据库
交通
车牌的识别,统计

互联网数据处理、精确营销:电影推荐系统、环境大数据

利用大数据实验环境完成一个真实的项目。了解常用的基于矩阵分解的协同过滤推荐算法的基本原理,掌握Spark MLlib中对基于模型的协同过滤算法的封装函数的使用,对Spark中机器学习模块内容加深理解。利用原始监测数据,根据时间的维度来进行统计,从而得出与该城市相关的日度及月度平均气温、空气质量优良及污染天数等等,从而为研究空气污染物扩散条件提供有力的数据支持。
互联网
大数据实验环境完成真实项目
精确营销
电影推荐系统
环境数据
根据时间的维度来进行统计

基于万物云快速开发智能硬件设备、银行用户贷款风险评估

了解智能硬件的开发过程;掌握基于万物云的智能硬件流程;熟悉智能硬件数据的上传,查询,分析。本次实验通过提取贷款用户相关特征(年龄、工作、收入等),使用Spark MLlib构建风险评估模型,使用相关分类算法将用户分为不同的风险等级,此分类结果可作为银行放贷的参考依据。
智能硬件
基于万物云快速开发智能硬件设备
风险评估
使用Spark MLlib构建风险评估模型

实战型综合实验

交通大数据

基于MapReduce思想,编写车牌识别程序。实现对江苏某两处监控图片中的车牌的识别,统计。

互联网数据

利用大数据实验环境完成一个真实的项目。

精确营销

基于矩阵分解的协同过滤推荐算法的基本原理,针对用户需求进行针对性的推荐。

环境大数据

利用原始监测数据,根据时间的维度来进行统计,从而得出与该城市相关的日度及月度平均气温、空气质量优良及污染天数等等,从而为研究空气污染物扩散条件提供有力的数据支持。

智能硬件

智能硬件数据的上传,查询,分析。

贷款风险评估

提取贷款用户相关特征(年龄、工作、收入等),使用Spark MLlib构建风险评估模型,使用相关分类算法将用户分为不同的风险等级,此分类结果可作为银行放贷的参考依据。

成功案例

内蒙古科技大学,使用大数据教学实验平台已有一年以上,针对现有师资力量培训和线上教学已有了一定的经验和基础,根据需求不同和多样化具有多方面的解决方案。对于真实的大数据项目,也有一整套的实验方案和数据统计方案。

富秀大数据云教学平台配套内容

智能实验系统,操作简单易懂。全面的教学PPT。完整详细的实验操作手册。

  • 智能实验
  • 教学PPT
  • 实验手册

完整详细的教学视频一整套。岗前大数据师资力量培训体系。一键式创建集群绑定和销毁,操作简单。

  • 学习视频
  • 师资培训
  • 集群申请