敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 下载 fb2 pdf rb kindle 115盘 极速 azw3

敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍电子书下载地址
- 文件名
- [epub 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 epub格式电子书
- [azw3 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 azw3格式电子书
- [pdf 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 pdf格式电子书
- [txt 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 txt格式电子书
- [mobi 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 mobi格式电子书
- [word 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 word格式电子书
- [kindle 下载] 敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍 kindle格式电子书
内容简介:
《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据-价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig 及D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。
《敏捷数据科学:用Hadoop创建数据分析应用》适合所有与数据工作相关的从业者,同时也适合有志成为数据科学工作者的广大读者作为入门读物。
书籍目录:
第1 部分 起步 ............................................................... 1
第1 章 理论 .................................................................. 3
敏捷大数据 ............................................................................................................3
Big Words 定义 ......................................................................................................4
敏捷大数据团队 .....................................................................................................5
认识机遇和问题 ..............................................................................................6
敏捷大数据流程 ................................................................................................... 11
代码检查和结对编程 ...........................................................................................12
敏捷的场所:开发的效率 ....................................................................................13
协作空间 .......................................................................................................14
私人空间 .......................................................................................................14
个人空间 .......................................................................................................14
用大幅打印件明确表达想法 ................................................................................15
第2 章 数据 ............................................................... 17
电子邮件 ..............................................................................................................17
处理原始数据 ......................................................................................................18
原始的电子邮件 ............................................................................................18
结构化与半结构化数据 .................................................................................18
SQL ......................................................................................................................20
NoSQL .................................................................................................................24
序列化 ...........................................................................................................24
从演变的模式中抽取和展示特征 ..................................................................25
数据流水线 ...................................................................................................26
数据透视 ..............................................................................................................27
社交网络 .......................................................................................................28
时间序列 .......................................................................................................30
自然语言 .......................................................................................................31
概率 ...............................................................................................................33
小结 .....................................................................................................................35
第3 章 敏捷开发工具 ................................................... 37
可扩展性= 简洁...................................................................................................37
敏捷大数据处理 ...................................................................................................38
设置运行Python 的虚拟环境 ...............................................................................39
使用Avro 对事件进行序列化 ..............................................................................40
在Python 中使用Avro ..................................................................................40
收集数据 ..............................................................................................................42
使用Pig 处理数据................................................................................................44
安装Pig .........................................................................................................45
使用MongoDB 发布数据 ....................................................................................49
安装MongoDB ..............................................................................................49
安装MongoDB 的Java 驱动程序 .................................................................50
安装mongo-hadoop .......................................................................................50
用Pig 向MongoDB 推送数据 .......................................................................50
使用ElasticSearch 搜索数据 ................................................................................52
安装 ...............................................................................................................52
使用Wonderdog 整合ElasticSearch 和Pig ...................................................53
对工作流程的反思 ...............................................................................................55
轻量级的Web 应用 ..............................................................................................56
Python 和 Flask .............................................................................................56
展示数据 ..............................................................................................................58
安装Bootstrap ...............................................................................................58
启用Bootstrap ...............................................................................................59
使用d3.js 和nvd3.js 可视化数据 ..................................................................63
小结 .....................................................................................................................64
第4 章 在云端 ............................................................. 65
引言 .....................................................................................................................65
GitHub .................................................................................................................67
dotCloud ...............................................................................................................67
dotCloud Echo 服务 .......................................................................................68
Python 工作者服务 ........................................................................................71
Amazon Web Services ..........................................................................................71
Simple Storage Service ..................................................................................71
Elastic MapReduce ........................................................................................72
MongoDB 即服务 ..........................................................................................79
辅助工具(Instrumentation) ................................................................................81
Google Analytics ...........................................................................................81
Mortar Data ...................................................................................................82
第2 部分 登上金字塔 ................................................... 85
第5 章 收集和展示数据 ............................................... 89
整合软件栈 ..........................................................................................................90
收集并序列化收件箱 ...........................................................................................90
处理和发布邮件数据 ...........................................................................................91
在浏览器中显示邮件 ...........................................................................................93
用Flask 和pymongo 处理邮件数据 ..............................................................94
使用Jinja2 渲染HTML5 页面 ......................................................................94
敏捷检查点 ..........................................................................................................98
生成电子邮件清单 ...............................................................................................99
用MongoDB 显示邮件 .................................................................................99
对数据展示的分析 ...................................................................................... 101
搜索邮件 ............................................................................................................ 106
使用Pig,ElasticSearch 和Wonderdog 构建索引 ....................................... 106
在网页中搜索邮件数据 ............................................................................... 107
结论 ................................................................................................................... 108
第6 章 使用图表可视化数据 ....................................... 111
优秀的图表 ........................................................................................................ 112
抽取实体:邮件地址 ......................................................................................... 112
抽取邮件 ..................................................................................................... 112
对时间进行可视化 ............................................................................................. 116
结论 ................................................................................................................... 122
第7 章 利用报表探索数据 .......................................... 123
为数据添加联系 ................................................................................................. 126
用TF-IDF 从邮件中提取关键字 ........................................................................ 133
小结 ................................................................................................................... 138
第8 章 预测 .............................................................. 141
预测电子邮件的回复率 ...................................................................................... 142
个性化 ................................................................................................................ 147
小结 ................................................................................................................... 148
第9 章 驱动行动 ........................................................ 149
好邮件的属性 .................................................................................................... 150
使用朴素贝叶斯方法进行更好的预测 ............................................................... 150
P(Reply | From ∩ To) ........................................................................................ 150
P(Reply | Token) ................................................................................................. 151
实时预测 ............................................................................................................ 153
记录事件日志 .................................................................................................... 157
小结 ................................................................................................................... 157
索引 ........................................................................... 159
作者介绍:
作者介绍:Russsel Jurney 在美国和墨西哥的赌场开始他的数据分析生涯。他开发了一个 Web 应用来分析老虎机的性能。在经历了创业、交互式媒体和新闻业以后,他到了硅谷,在 Ning 和LinkedIn 开始构建可扩展的数据分析应用。
译者介绍:朱洪波 阿里巴巴数据挖掘专家,机器学习团队负责人,司职于解决商业客户对数据的深层需求。纸质书爱好者,相信理性与逻辑的力量。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据-价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig 及D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。
《敏捷数据科学:用Hadoop创建数据分析应用》适合所有与数据工作相关的从业者,同时也适合有志成为数据科学工作者的广大读者作为入门读物。
网站评分
书籍多样性:9分
书籍信息完全性:6分
网站更新速度:4分
使用便利性:7分
书籍清晰度:8分
书籍格式兼容性:5分
是否包含广告:8分
加载速度:9分
安全性:6分
稳定性:5分
搜索功能:7分
下载便捷性:7分
下载点评
- 值得下载(483+)
- 速度慢(117+)
- txt(164+)
- 好评(660+)
- 少量广告(183+)
- 无缺页(214+)
- 品质不错(325+)
- 种类多(601+)
下载评价
- 网友 常***翠:
哈哈哈哈哈哈
- 网友 权***波:
收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 沈***松:
挺好的,不错
- 网友 冯***卉:
听说内置一千多万的书籍,不知道真假的
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 敖***菡:
是个好网站,很便捷
- 网友 田***珊:
可以就是有些书搜不到
- 网友 家***丝:
好6666666
- 网友 冉***兮:
如果满分一百分,我愿意给你99分,剩下一分怕你骄傲
- 网友 孙***美:
加油!支持一下!不错,好用。大家可以去试一下哦
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 郗***兰:
网站体验不错
- 网友 寇***音:
好,真的挺使用的!
喜欢"敏捷数据分析工具箱 深入解析ADW+OAC 电子工业出版社9787121409189史跃东 敏捷数据分析的相关工具书籍"的人也看了
博识小学英语听力100篇(含MP3下载) 下载 fb2 pdf rb kindle 115盘 极速 azw3
未成年5 下载 fb2 pdf rb kindle 115盘 极速 azw3
名家名译 金熊猫世界文学经典:青鸟 下载 fb2 pdf rb kindle 115盘 极速 azw3
英国公司法精要【正版图书,满额减】 下载 fb2 pdf rb kindle 115盘 极速 azw3
鍑中乾坤:青铜鍑与草原文明 郭物 著 上海社会科学院出版社【正版保证】 下载 fb2 pdf rb kindle 115盘 极速 azw3
英语笔译实务教材2级 (中)贺莺【正版保证】 下载 fb2 pdf rb kindle 115盘 极速 azw3
2014文都教育 汤家凤 考研数学套装:接力题典1800题 + 15年真题解析 数学一 下载 fb2 pdf rb kindle 115盘 极速 azw3
中国.2014 无 著 钟欣 编 安义运 译 下载 fb2 pdf rb kindle 115盘 极速 azw3
灵魂摆渡人-重口味心理咨询实录9787549618705 正版新书希望阶梯图书专营店 下载 fb2 pdf rb kindle 115盘 极速 azw3
软件设计师教程(第三版)(修订版)(全国计算机技术与软件专业技术资格(水平)考试 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 网络综合布线技术 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 沈石溪十二生肖故事 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 临床出血与血栓性疾病 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 历代名人全传 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 工程自动算量软件应用(广联达BIM土建计量平台GTJ版) 中国建筑工业出版社 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 图解轻松分娩、坐月子 徐文 编著 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 世界秩序 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 新商务英语综合教程 (3) 清华大学出版社 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 国有企业合规前沿与实务探索 下载 fb2 pdf rb kindle 115盘 极速 azw3
- 机械工程材料综合练习与模拟试题 普通高等教育“十三五”规划“互联网+”精品教材 下载 fb2 pdf rb kindle 115盘 极速 azw3
书籍真实打分
故事情节:8分
人物塑造:9分
主题深度:5分
文字风格:7分
语言运用:6分
文笔流畅:3分
思想传递:4分
知识深度:8分
知识广度:7分
实用性:7分
章节划分:5分
结构布局:7分
新颖与独特:6分
情感共鸣:6分
引人入胜:4分
现实相关:6分
沉浸感:6分
事实准确性:9分
文化贡献:6分