数据算法:HadoopSpark大数据处理技巧 PDF 下载 下载地址: 版权归出版社和原作者所有,链接已删除,请购买正版 电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍: https://product.dangdang.com/11707944928.html
用户下载说明:
相关截图:
资料简介:
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。
本书主要内容包括:
■完成超大量交易的购物篮分析。
■数据挖掘算法(K-均值、KNN和朴素贝叶斯)。
■使用超大基因组数据完成DNA和RNA测序。
■朴素贝叶斯定理和马尔可夫链实现数据和市场预测。
■ 推荐算法和成对文档相似性。
■线性回归、Cox回归和皮尔逊(Pearson)相关分析。
■等位基因频率和DNA挖掘。
■社交网络分析(推荐系统、三角形计数和情感分析)。