博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive学习(六)DML数据操作
阅读量:3906 次
发布时间:2019-05-23

本文共 1606 字,大约阅读时间需要 5 分钟。

目录


数据导入

装载数据(Load)

语法:

load data [local] inpath 'file_path' [overwrite] into table tb_name [partition(partcol1=val1,...)]
  1. load data:表示加载数据

  2. local:表示从本地加载数据到 hive 表;否则从 HDFS 加载数据到 hive 表

  3. inpath:表示加载数据的路径

  4. overwrite:表示覆盖表中已有数据,否则表示追加

  5. into table:表示加载到哪张表

  6. tb_name:表示具体的表

  7. partition:表示上传到指定分区

案例,加载本地数据到student表中:

hive> load data local inpath '/opt/module/datas/student.txt' into table student_part partition(dt='201912');Loading data to table iceink.student_part partition (dt=201912)Partition iceink.student_part{dt=201912} stats: [numFiles=2, numRows=0, totalSize=96, rawDataSize=0]OK

通过查询语句向表中插入数据(Insert)

-- 基本插入数据insert into table student_part partition(dt='201909') values(1,'posion',20);​-- 根据单张表查询结果insert overwrite table student_part partition(dt='201909') select id,name,age from student_part where dt = '201911';

查询语句中创建表并加载数据(As Select)

create table if not exists student_copy2 as select id,name,age from student;

数据导出

数据导出有很多种方式,如:Insert导出、Hadoop命令导出、Hive Shell导出、Export导出、Sqoop导出

下面主要介绍Insert导出。

-- 将查询结果导出到本地insert overwrite local directory '/opt/module/datas/student' select * from student;​结果数据:1iceink182icydate18​-- 将查询结果格式化导出到本地insert overwrite local directory '/opt/module/datas/student' row format delimited fields terminated by '\t' select * from student;​结果数据:1   iceink  182   icydate 18​-- 将查询结果导出到HDFS上,没有localinsert overwrite directory '/opt/module/datas/student' select * from student;

清除表中数据

语法: truncate table tb_name;

注意:

Truncate 只能删除管理表,不能删除外部表中数据

hive> truncate table student_external; FAILED: SemanticException [Error 10146]: Cannot truncate non-managed table student_external.

转载地址:http://xiqen.baihongyu.com/

你可能感兴趣的文章
机器学习 数据挖掘 数据集划分 训练集 验证集 测试集
查看>>
从不同角度看机器学习的几种学习方式
查看>>
数据挖掘 NLP 之 文本挖掘 文本处理 通用流程
查看>>
NLP 主题抽取 Topic LDA代码实践 gensim包 代码
查看>>
NLP 工具包 大调查 自然语言处理工具包合集
查看>>
scrapy爬取酒店评论数据
查看>>
各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)
查看>>
软考相关英语
查看>>
[老老实实学WCF] 第四篇 初探通信--ChannelFactory
查看>>
ASP.NET 中的 Async/Await 简介
查看>>
解决Chrome中调试JS提示“Uncaught TypeError: Cannot use 'in' operator to search for”错误信息问题
查看>>
阿里巴巴java规范 第一版
查看>>
USB通信记事
查看>>
Android 编译(1)——Android编译步骤梳理
查看>>
编译器配置(1)——ARMv7,ARMv8(AArch64) 浮点配置等相关知识
查看>>
RK3399 OV13850摄像头配置
查看>>
Android 编译(2)——jack-server相关问题
查看>>
网络服务(2)——以太网配置IPV4和IPV6
查看>>
网络服务(3)——以太网phy的识别加载(RK3399)
查看>>
网络服务(5)——usb网卡名称修改(RK3399 Ubuntu)
查看>>