欢迎光临本店     登录 注册   加入收藏
  •   
欢迎光临清华大学出版社第三事业部!

此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

当前位置: 首页 > 科技 > 计算机与网络 > 数据之魅:基于开源工具的数据分析

浏览历史

数据之魅:基于开源工具的数据分析

数据之魅:基于开源工具的数据分析

prev

  • 商品货号:01372012-7-20-2780
  • 商品重量:0克
    作者:(美)雅奈特(Janert, K. P.)
    图书书号/ISBN:9787302268925
    出版日期:2012-07-01
    印张:32.75
    字数:715千字
    开本:16
  • 上架时间:2012-07-20
    商品点击数:1150
  • 定价:¥89.00元
    本店售价:¥32.75元
    注册用户:¥32.75元
    vip:¥31.11元
    黄金等级:¥29.48元
    用户评价: comment rank 5
  • 商品总价:
  • 购买数量:

内容简介:

商品附加资源

本书结合作者多年来从事数据分析工作的丰富经验,阐述了数据分析所涉及的概念和方法。 本书共四部分 19章,主题包括如何通过图表来观察数据,如何通过各种建模方法来分析数据,然后着重阐述如何进行数据挖掘,最后强调数据分析在商业和金融等领域的实际应用。本书包含大量的模拟过程及结果展示,并通过实例来阐述如何使用开源工具来进行数据分析。通过本书的阅读,读者可以清楚地了解这些方法的实际用法及用途。 本书结构合理,通俗易懂,适合数据分析爱好者和从业者阅读,也适合以科学计算为工具的科研人员参考。同时,本书还适用于计算机科学、数学、工程技术和其他相关专业本科或研究生的数据分析课程,是一本不错的参考书。
目录 第1章 导论..................................... 1 关于数学........................................ 4 需要具备的知识............................. 6 数 据 分 析........................................ 1 本书不涉及的内容......................... 6 本 书 内 容........................................ 2 关 于 讲 习班.................................... 3 第Ⅰ部分 第2章 单一变量:形状和 图表:观察数据 第3章 两个变量:建立关系... 47 分布................................... 11 散点图......................................... 47 数 据 点 和抖 动 图........................... 12 直 方 图 和核 密 度 估 计.................... 14 直 方图.................................. 15 核 密度 估计........................... 19 (选 学)如 何 选 择 最 优 带宽...... 22 累 积 分 布函 数............................... 23 (选 学)概 率 图 分 布 和QQ图 分 布 的 对比........................... 25 秩 序 图 和上 升 图........................... 30 仅 用 于 适当 时 机 : 汇 总统 计 量 和 箱 形 图...................................... 33 汇 总 统 计量........................... 33 Box-and-Whisker图.............. 36 (讲 习 班)NumPy ............................ 38 NumPy实 践.......................... 38 NumPy详 解.......................... 41 扩 展 阅 读...................................... 45 克服噪声:平滑........................... 48 样条...................................... 50 LOESS .................................. 51 示例...................................... 52 残差...................................... 54 其他观点及提醒................... 55 对数图......................................... 57 倾斜............................................. 61 线性回归以及诸如此类的方法..... 62 描述重要信息.............................. 66 图形分析与图形演示................... 68 (讲习班)matplotlib ....................... 69 交互式使用matplotlib .......... 70 案例学习:matplotlib与 LOESS .................................. 73 控制属性.............................. 74 matplotlib对象模型及结构... 76 变种.....................................108 组成问题..................................... 110 扩 展 阅 读...................................... 78 组成的改变.......................... 110 第4章 以时间为变量: 时序分析.......................... 79 多维组成:树形图和 马赛克图............................. 112 示 例............................................. 79 任 务............................................. 83 需 求和 现实........................... 84 平 滑 处 理...................................... 84 移 动平 均法........................... 85 指 数平 滑法........................... 86 不 要 忽 视显 而 易 见 的 东西............ 90 相 关 函 数...................................... 91 示 例...................................... 92 实 现 上 的问 题....................... 93 (选 学)过 滤 器 和 卷 积..................... 95 (讲 习 班)scipy.signal ..................... 96 扩 展 阅 读...................................... 98 第5章 多变量:图形的多变量 分析................................... 99 假 色 图........................................ 100 概 览 : 多值 图............................. 105 散 点图 矩阵......................... 105 协 作图................................ 107 新颖的曲线类型.......................... 116 标识符................................. 116 平行坐标图.......................... 117 交互式探索.................................120 查询和缩放..........................121 连接和涂层..........................121 大游览与投影寻踪...............121 工具.....................................122 (讲习班)多变量图形工具............123 R .........................................123 实验工具.............................124 Python的Chaco库..............124 扩展阅读.....................................125 第6章 插曲:数据分析会话.. 127 数据分析会话.............................127 (讲习班)gnuplot软件..................136 扩展阅读.....................................138 第Ⅱ部分 分析:数据建模 第7章 推算和粗略计算...........141 使用数字.............................146 推 算 的 原理................................ 142 估 计大 小............................ 143 建 立关 联............................ 145 10的幂................................146 小扰动.................................147 对数.....................................148 更 多 示 例............................ 149 我 所 知 道的 一 些 常 见 事(物) 的 相 关 数字......................... 151 这 些 数 字是 否 足 够 好 ?.............. 151 准 备 工 作: 可 行 性 和 成本... 153 完 成 之 后: 引 用 和 呈 现 数 字............................ 154 (选 学)进一 步 探 索 摄 动理 论 和 误 差 传 播.................................... 155 误 差 传 播............................ 156 (讲 习 班)Gnu科 学 库(GSL).......... 158 扩 展 阅 读.................................... 161 第8章 缩放参数模型................163 模 型........................................... 163 建 模.................................... 164 模 型的 运用 和 误 用.............. 164 参 数 的 缩放................................ 165 缩 放参 数............................ 165 示 例: 维度 参 数................. 167 示 例: 优化 问 题................. 169 示 例: 成本 模 型................. 170 (选 学)缩 放 参 数 与 量 纲 分 析............................ 172 其 他 理 论............................ 174 平 均 场 近似................................ 175 背 景 知 识和 其 他 示 例.......... 176 常 见 的 时间 演 变 方 案.................. 178 无 限增 长和 衰 减 现 象.......... 178 约束增长:逻辑斯谛方程....180 振荡.....................................181 案例学习:多少台服务器才是 最好的?.....................................182 为什么要建模?..........................184 (讲习班)Sage...............................184 扩展阅读.....................................188 第9章 关于概率模型的讨论... 191 二项分布和伯努利试验......191 9.1 精确的结果..........................192 利用伯努利试验建立平均场 模型....................................194 高斯分布和中心极限定理...195 9.2 中心极限定理......................195 中心项与尾项......................197 为什么高斯分布如此实用?198 (选学)高斯积分...................199 幂律分布和非常规统计学...........201 幂律分布的用法..................203 (选学)期望值为无限时的 分布....................................204 接下来的研究......................206 其他分布.....................................206 几何分布.............................207 泊松分布.............................207 对数正态分布......................209 特殊用途的分布.................. 211 (选 学)案 例 学 习——随 时 间 变 化 的 单 一 访 问 者 数 量........................... 211 (讲 习 班)幂 律 分 布...................... 215 扩 展 阅 读.................................... 219 第10章 你真正需要了解的 经典统计学知识.........221 起 源........................................... 221 统 计 学 的定 义............................. 223 从 统 计 学角 度 解 释..................... 226 示 例: 公式 测 验 VS图 解 法.......................... 229 控 制 实 验VS观 察 研 究............... 230 实 验设 计............................ 232 前 景.................................... 234 (选 学)贝叶 斯 统 计—— 另 一 种 观点................................ 235 用 频 率 论来 解 释 概 率.......... 235 用 贝叶 斯方 法 来 理 解 概率... 236 贝叶斯数据分析:一个实际有 效的例子.............................238 贝叶斯推理:总结与讨论....241 (讲习班)R语言...........................243 扩展阅读.....................................249 第11章 插叙:数学大搜捕—— 大脚怪和最小二 乘等............................... 253 如何平均均值...................253 11.1 辛普森(Simpson)悖论..........254 标准差........................................256 如何计算.............................258 (选学)应该选择哪一个........259 (选学)标准误差...................259 最小二乘.....................................260 统计参数估计......................261 函数逼近.............................263 扩展阅读.....................................264 第Ⅲ部分 计算:数据挖掘 第12章 模拟................................267 拔靴法适用于哪些情况?....278 热 身 问 题.................................... 267 蒙 特 卡 洛模 拟............................. 270 组 合问 题............................ 270 获 得结 果分 布..................... 272 优 点和 缺点......................... 275 重 新 采 样方 法............................. 276 拔 靴法................................ 277 拔靴变量.............................280 (讲习班)SimPy离散事件模拟.....280 SimPy简介..........................281 最简单的排队过程...............282 (选学)排队理论...................285 运行SimPy模拟..................288 小结............................................290 扩 展 阅 读.................................... 291 第13章 找出簇...........................293 簇 由 什 么组 成 ?......................... 293 一 种 不 同的 观 点......................... 296 距 离 计 算和 相 似 度 计 算.............. 298 常 见的 距离 和 相 似 度 计 算 方 法............................ 300 聚 类 方 法.................................... 304 中 心 探 索法......................... 305 树 形 构 造器......................... 307 邻 居 生 长器......................... 309 前 期 处 理和 后 期 处 理.................. 311 规 模的 规范 化..................... 311 类 的 属 性和 评 估................. 311 其 他 想 法.................................... 314 具 体 案 例: 超 市 购 物 篮的 分 析.................................... 316 提 醒........................................... 319 (讲 习 班)Pycluster和C聚 类 库... 320 扩 展 阅 读.................................... 324 第14章 一木见林: 找出重要属性..............327 主成分分析法.............................328 动机.....................................328 (选学)理论...........................330 解释.....................................333 计算.....................................334 实用观点.............................335 双标图.................................336 可视化技术.................................337 多元尺度法..........................338 网络图.................................339 柯霍南图.....................................339 (讲习班)用R进行PCA...............342 扩展阅读.....................................348 线性代数.............................349 第15章 插曲:当数据不成 比例地增长时............. 351 一个真实的故事..........................353 一些建议.....................................354 map/reduce如何..........................356 (讲习班)生成排列.......................357 扩展阅读.....................................358 第Ⅳ部分 第16章 报表、商务智能和 应用:数据的使用 关于指标计划的建议...........370 仪表板...........................361 数据的质量问题..........................373 商 务 智 能.................................... 362 报 表.................................... 364 企 业 指 标和 仪 表 板..................... 369 数据的可用性......................373 数据的一致性......................375 (讲习班)Berkeley DB和SQLite ....376 一些分类术语.............................407 Berkeley DB ........................ 377 分类算法.....................................408 SQLite ................................ 379 基于实例的分类和最近邻 扩 展 阅 读.................................... 381 第17章 金融计算与建模.........383 货 币 的 时间 价 值......................... 384 一 次性 支付 : 未 来 值 和 现 值.................................... 384 多 笔付 款: 复 利................. 386 复 利的 计算 技 巧................. 387 概 览: 现金 流 分 析 和 净 现值................................ 389 计 划 成 本和 机 会 成 本 中的 不 确 定 性.................................... 391 用 账 户 的期 望 值 来 考 虑 不 确 定 性............................ 391 机 会 成 本............................ 393 成 本 概 念及 贬 值......................... 394 直 接 成 本和 间 接 成 本.......... 394 固 定 成 本和 可 变 成 本.......... 396 资 本 开 支与 运 营 成 本.......... 397 是 否 应 该加 以 关 注 ?.................. 398 这 些 就 是全 部 吗 ?..................... 399 (讲 习 班)报 纸 经 销 商 问题........... 400 (选 学)精 确 解...................... 402 扩 展 阅 读.................................... 403 报 纸 经 销商 问 题................. 404 第18章 预测分析......................405 预 测 分 析的 主 题......................... 406 分类算法.............................409 贝叶斯分类器......................409 回归.....................................413 支持向量机..........................414 决策树和基于规则的 分类器.................................416 其他分类算法......................418 流程............................................419 集成方法:Bagging和 Boosting ..............................419 估计预测误差......................420 类不平衡问题......................421 私家秘诀.....................................423 统计学习的本质..........................424 (讲习班)自己编写的两个 分类器........................................426 扩展阅读.....................................431 第19章 结语:事实并非 现实.............................433 附录A 科学计算与数据分析的 编程环境......................... 435 附录B 应用:微积分................ 447 附录C 使用数据......................... 485 索引.................................................... 499

商品标签

购买记录(近期成交数量0)

还没有人购买过此商品
总计 0 个记录,共 1 页。 第一页 上一页 下一页 最末页

用户评论(共0条评论)

  • 暂时还没有任何用户评论
总计 0 个记录,共 1 页。 第一页 上一页 下一页 最末页
用户名: 匿名用户
E-mail:
评价等级:
评论内容:
验证码: captcha