Hive编程指南

$ 32.40

    《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,很终演示Hive如何在Hadoop生态系统进行工作。
    《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。

More than 20 In stock - 邮寄至 澳洲、新西兰(最快7个工作日送达)。目前由于疫情,物流公司无法保证邮寄时间,详情请看首页通知。

SKU: 1200807864 分类:

Description

  商品基本信息,请以下列介绍为准
商品名称:   Hive编程指南
作者:   (美)卡普廖洛 等 著 曹坤 译
译者:   曹坤
ISBN号:   9787115333834
出版社:   人民邮电出版社
商品类型:   图书

  其他参考信息(以实物为准)
  装帧:平装   开本:   语种:
  出版时间:2013年12月01日   版次:1   页数:318
  印刷时间:   印次:1   字数:428.00千字

  内容简介
    《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,很终演示Hive如何在Hadoop生态系统进行工作。
    《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。

  目录
章基础知识
1.1Hadoop和MapReduce综述
1.2Hadoop生态系统中的Hive
1.2.1Pig
1.2.2HBase
1.2.3Cascading、Crunch及其他
1.3Java和Hive:词频统计算法
1.4后续事情
第2章基础操作
2.1安装预先配置好的虚拟机
2.2安装详细步骤
2.2.1装Java
2.2.2安装Hadoop
2.2.3本地模式、伪分布式模式和分布式模式
2.2.4测试Hadoop
2.2.5安装Hive
2.3Hive内部是什么
2.4启动Hive
2.5配置Hadoop环境
2.5.1本地模式配置
2.5.2分布式模式和伪分布式模式配置
2.5.3使用JDBC连接元数据
2.6Hive命令
2.7命令行界面
2.7.1CLI选项
2.7.2变量和属性
2.7.3Hive中“一次使用”命令
2.7.4从文件中执行Hive查询
2.7.5hiverc文件
2.7.6使用HiveCLI的更多介绍
2.7.7查看操作命令历史
2.7.8执行shell命令
2.7.9在Hive内使用Hadoop的dfs命令
2.7.10Hive脚本中如何进行注释
2.7.11显示字段名称
第3章数据类型和文件格式
3.1基本数据类型
3.2集合数据类型
3.3文本文件数据编码
3.4读时模式
第4章HiveQL:数据定义
4.1Hive中的数据库
4.2修改数据库
4.3创建表
4.3.1管理表
4.3.2外部表
4.4分区表、管理表
4.4.1外部分区表
4.4.2自定义表的存储格式
4.5删除表
4.6修改表
4.6.1表重命名
4.6.2增加、修改和删除表分区
4.6.3修改列信息
4.6.4增加列
4.6.5删除或者替换列
4.6.6修改表属性
4.6.7修改存储属性
4.6.8众多的修改表语句
第5章HiveQL:数据操作
5.1向管理表中装载数据
5.2通过查询语句向表中插入数据
5.3单个查询语句中创建表并加载数据
5.4导出数据
第6章HiveQL:查询
6.1SELECT…FROM语句
6.1.1使用正则表达式来指定列
6.1.2使用列值进行计算
6.1.3算术运算符
6.1.4使用函数
6.1.5LIMIT语句
6.1.6列别名
6.1.7嵌套SELECT语句
6.1.8CASE…WHEN…THEN句式
6.1.9什么情况下Hive可以避免进行MapReduce
6.2WHERE语句
6.2.1谓词操作符
6.2.2关于浮点数比较
6.2.3LIKE和RLIKE
6.3GROUPBY语句
6.4JOIN语句
6.4.1INNERJOIN
6.4.2JOIN优化
6.4.3LEFTOUTERJOIN
6.4.4OUTERJOIN
6.4.5RIGHTOUTERJOIN
6.4.6FULLOUTERJOIN
6.4.7LEFTSEMI—JOIN
6.4.8笛卡尔积JOIN
6.4.9map—sideJOIN
6.5ORDERBY和SORTBY
6.6含有SORTBY的DISTRIBUTEBY
6.7CLUSTERBY
6.8类型转换
6.9抽样查询
6.9.1数据块抽样
6.9.2分桶表的输入裁剪
6.10UNIONALL
第7章HiveQL:视图
7.1使用视图来降低查询复杂度
7.2使用视图来限制基于条件过滤的数据
7.3动态分区中的视图和map类型
7.4视图零零碎碎相关的事情
第8章HiveQL:索引
8.1创建索引
8.2重建索引
8.3显示索引
8.4删除索引
8.5实现一个定制化的索引处理器
第9章模式设计
9.1按天划分的表
9.2关于分区
9.3唯一键和标准化
9.4同一份数据多种处理
9.5对于每个表的分区
9.6分桶表数据存储
9.7为表增加列
9.8使用列存储表
9.8.1重复数据
9.8.2多列
9.9(几乎)总是使用压缩
0章调优
10.1使用EXPLAIN
10.2EXPLAINEXTENDED
10.3限制调整
10.4JOIN优化
10.5本地模式
10.6并行执行
10.7严格模式
10.8调整mapper和reducer个数
10.9JVM重用
10.10索引
10.11动态分区调整
10.12推测执行
10.13单个MapReduce中多个GROUPBY
10.14虚拟列
1章其他文件格式和压缩方法
11.1确定安装编解码器
11.2选择一种压缩编/解码器
11.3开启中间压缩
11.4最终输出结果压缩
11.5sequencefile存储格式
11.6使用压缩实践
11.7存档分区
11.8压缩:包扎
……
2章开发
3章函数
4章Streaming
5章自定义Hive文件和记录格式
6章Hive的Thrift服务
7章存储处理程序和NoSQL
8章安全
9章锁
第20章Hive和Oozie整合
第21章Hive和亚马逊网络服务系统(AWS)
第22章HCatalog
第23章案例研究
术语词汇表

Additional information

Weight 510 g
Dimensions 23.7 × 18.1 × 1.5 cm
作者

出版社

人民邮电出版社

页数

318

版次

1

出版日期

2013-12-01

装帧

平装

开本

16开

印次

1

isbn

9787115333834

印刷时间

2013-12-01

商品编码

1200807864

发货时间:可邮寄至 澳洲、新西兰。周一至周五 每天早上8点发货。
2KG 以下:国际快递(普通空运),邮费$15。发货后一般10~15个工作日到。(可买够2KG,自动升级为下面的国际特快。)
2KG 以上:国际特快,邮费$15。发货后一般7个工作日左右到。

--- 限时促销活动(查看首页) ---


邮寄公司:澳洲为AusPost负责送货;新西兰为NZPost。如送达时没人签收,可以前去附近的邮局领取。

查看 - 实际快递运输时间


注1:书本介绍页面有标明该书的重量 。结算时系统也会自动计算总重量。
注2:邮寄至新西兰有时需要多1~3个工作日。

我们的优势

  1. 可购买到超过25万种简体中文书。
  2. 快速邮寄-购买超过2KG的书便可自动升级为特快邮寄,发货后约7个工作日送达。
  3. 空运运输-所有书都是使用国际空运运输(不用在海上漂几个月)。
  4. 快速、简单的图书预订服务 -没有找到想要的书?我们会在1~2个工作日增加到网站上供您下单。
  5. 除网站外,还能微信直接留言下单/预订。
  6. 方便快速友好的咨询方式:微信(微信不打扰承诺),每天至少12小时在线(10am-10pm)。
  7. 新书介绍,原创书评(我们亲自读过并觉得不错的书;如果不合书友们的喜好,还望见谅;欢迎在书评下面留言:)
  8. 因为热爱,我们认真的对待每一本书

Reviews

There are no reviews yet.

Be the first to review “Hive编程指南”