
会员
数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow
谢梁 缪莹莹 高梓尧 王子玲等更新时间:2021-06-24 11:29:59
最新章节:12.4 本章小结开会员,本书免费读 >
这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结,得到了SQLFlow创始人以及腾讯、网易、快手、贝壳找房、谷歌等企业的专家一致好评和推荐。全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的Z新技术和发展动向。内容围绕非实验环境下的观测数据的分析、实验的设计和分析、自助式数据科学平台3大主题展开,涉及统计学、经济学、机器学习、实验科学等多个领域,包含大量常用的数据科学方法、简洁的代码实现和经典的实战案例。第1部分(第1~6章)观测数据的分析技术讲解了非实验环境下不同观测数据分析场景所对应的分析框架、原理及实际操作,包括消费者选择偏好分析、消费者在时间维度上的行为分析、基于机器学习的用户生命周期价值预测、基于可解释模型技术的商业场景挖掘、基于矩阵分解技术的用户行为规律发现与挖掘,以及在不能进行实验分析时如何更科学地进行全量评估等内容。第二部分(第7~9章)实验设计和分析技术从A/B实验的基本原理出发,深入浅出地介绍了各种商业场景下进行实验设计需要参考的原则和运用的方法,尤其是在有样本量约束条件下提升实验效能的方法及商业场景限制导致的非传统实验设计。第三部分(第10~12章)自助式数据科学平台SQLFlow针对性的讲解了开源的工程化的自助式数据科学平台SQLFlow,并通过系统配置、黑盒模型的解读器应用、聚类分析场景等案例帮助读者快速了解这一面向未来的数据科学技术。
品牌:机械工业出版社
上架时间:2021-06-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow最新章节
查看全部- 12.4 本章小结
- 12.3 SQLFlow中基于深度学习的聚类模型
- 12.2 聚类模型的应用案例
- 12.1 聚类分析的广泛应用
- 第12章 基于LSTM-Autoencoder的无监督聚类模型
- 11.4 本章小结
- 11.3 黑盒模型的解释性
- 11.2 常见的可解释模型
- 11.1 模型的可解释性
- 第11章 机器学习模型可解释性
谢梁 缪莹莹 高梓尧 王子玲等
主页
最新上架
- 会员
大数据SQL优化:原理与实践
这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字 - 会员
码上行动:利用Python与ChatGPT高效搞定Excel数据分析
本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。计算机8.5万字 - 会员
Python数据分析与挖掘实战
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字 - 会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,计算机12万字 - 会员
PySpark大数据分析与应用
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例计算机10.4万字 - 会员
新媒体数据分析基础教程
本书共8章,第1章介绍新媒体数据分析的基础知识;第2章介绍各种新媒体数据分析指标;第3章介绍新媒体数据的采集;第4章介绍新媒体数据处理;第5章介绍新媒体数据分析的思维和方法;第6章介绍新媒体数据可视化;第7章介绍不同新媒体平台的数据分析方法和实战技能;第8章介绍新媒体数据分析报告的制作。计算机9.2万字 - 会员
大数据导论
本书围绕新工科背景下大数据人才培养需求编写,既涵盖了大数据的基础知识,又介绍了大数据分析的相关工具与案例。全书共9章,介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程;重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用,还介绍了大数据实验环境的详细搭建步骤,方便读者快速理解和体验大数据应用技术;最后介绍了大数据治理中法律政策、行业标准建设的计算机14.5万字 - 会员
算法设计与分析
为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法,本书按照算法策略进行划分,每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章,内容包括:算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用计算机9.4万字 - 会员
MySQL数据库基础实例教程
本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不计算机7.8万字