既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
需要这份系统化资料的朋友,可以戳这里获取
2.1 DataWrangler
斯坦福大学可视化组(SUVG)设计的基于web的服务,可用来清理和重列数据。点击一个行或列, 会弹出建议变化。比如如果你点击了一个空行,一些建议弹出,删除或删除空行的提示。它的文本编辑很cool。
2.2 Google Refine
Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个 CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。
三、统计分析(Statistical analysis)
有时,你需要你的数据的图形化的表达。
3.1 R 项目
R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可比美GNU Octave甚至商业软件MATLAB要快。 可视化应用与服务(Visualization applications and services) 这些工具提供了不同的可视化选项,针对不同的应用场景。
3.2 Google Fusion Tables
Google Fusion Tables 被认为是云计算数据库的雏形。还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google Docs里的表格导入进来使用。对于大规模的数据,可以用Google Fusion Tables创造过滤器来显示你关心的数据,处理完毕后可以导出为csv文件。
Google Fusion Tables的处理大数据量的强大能力,以及能够自由添加不同的空间视图的功能,也许会让 Oracle,IBM, Microsoft传统数据库厂商感到担心,Google未来会强力介入数据库市场。
3.3 Impure
Impure,允许点击、拖曳来连接模块,由西班牙分析公司Bestiario 创建。
3.4 Tableau Public
3.5 Many Eyes
3.6 VIDI
3.7 Zoho Reports
3.8 Choosel
3.9 Exhibit
3.10 Google Chart Tools
3.11 Javascript InfoVis Toolkit
3.12 Protovis
3.13 Quantum GIS (QGIS)
3.14 OpenHeatMap
3.15 penLayers
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化资料的朋友,可以戳这里获取
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
bbs.csdn.net/topics/618545628)**