博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop 面试题 之Hive
阅读量:5734 次
发布时间:2019-06-18

本文共 2198 字,大约阅读时间需要 7 分钟。

1.Hive 有哪些方式保存元数据,各有哪些特点。

 

15. Hive内部表和外部表的区别

23.hive底层与数据库交互原理

Hive的Hql语句掌握情况?

36.使用Hive或自定义mr实现如下逻辑:

product_no lac_id moment start_time user_id county_id staytime city_id 13429100031 22554 8 2013-03-11 08:55:19.151754088 571 571 282 571 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 103 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100140 26642 9 2013-03-11 09:02:19.151754088 571 571 18 571 13429100082 22691 8 2013-03-11 08:57:32.151754088 571 571 287 571 13429100189 22558 8 2013-03-11 08:56:24.139539816 571 571 48 571 13429100349 22503 8 2013-03-11 08:54:30.152622440 571 571 211 571 字段解释: product_no:用户手机号; lac_id:用户所在基站; start_time:用户在此基站的开始时间; staytime:用户在此基站的逗留时间。 需求描述: 根据 lac_id 和 start_time 知道用户当时的位置,根据 staytime 知道用户各个基站的逗留时 长。根据轨迹合并连续基站的 staytime。 最终得到每一个用户按时间排序在每一个基站驻留时长 期望输出举例: 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 390 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 Linux 脚本能力考察:

59.pig latin,hive 语法有什么不同
71.hive如何调优

72.hive 如何权限控制?

 

74.hive能像关系数据库那样,建多个库吗?

110. hive 实现统计的查询语句是什么?

115.对比hive与mapreduce统计手机流量的区别?

HIve也问了一些,外部表,还有就是hive的物理模型跟传统数据库的不同

134.Hive元数据保存的方法有哪些,各有什么特点?

145.对于hive,你写过哪些udf函数,作用是什么?

148.hive 底层与数据库交互原理。

362.你们写hive的hql语句,大概有多少条?

364.hive 跟hbase的区别是?
379.hive 中的压缩格式RCfile .TextFile SequenceFile 各有什么区别?

以上3种格式一样大的文件哪个占用空间大小,还有hadoop中的一个HA压缩。

395.你们hive处理数据能到到的指标是多少?

408.Hive 的工作原理、两种元数据存放方式、几种表之间的区别、数据导入的几种方式、几种文件格式、UDF函数、性能调优(重点是join 的时候如何放置大小表)?

412.hive的两张表关联,使用mapreduce 是怎么写的?

提示:打标记笛卡尔乘积

413.hive 相对于oracle来说有哪些优点?

提示:hive 是数据仓库,oracle是数据库,hive 能够存储海量数据,hive还有更重要的作用就是数据分析,最主要的是免费。

472.hive优化

475.hive的sort by 和 order by 的区别

476.Hive里面用什么代替in 查询

提示:Hive中的left semi join 替换sql 中的in 操作

488.hive如何优化

549.你们用hive-15啊

转载于:https://www.cnblogs.com/chaoren399/p/4714780.html

你可能感兴趣的文章
解决cacti监控windows网卡带有中文
查看>>
梁念坚:“云计算”福音
查看>>
管理软件的飞跃:像用自来水一样用
查看>>
四块固态硬盘联合刷新PCMark05世界记录
查看>>
浅析信息化时代 医院混合云建设模式
查看>>
Gigamon针对AWS引入全面可视化平台
查看>>
DTCC2015议程曝光 最新嘉宾议题揭秘
查看>>
BAT、IBM、亚马逊、微软等一线互联网的区块链版图布局
查看>>
智能合约:开启一个新经济时代
查看>>
[翻译] JavaScript函数的6个基本术语
查看>>
vue静态资源打包中的坑与解决方案
查看>>
Lc 895. Maximum Frequency Stack 最大频率栈 JS
查看>>
j2ee分布式架构 dubbo + springmvc + mybatis + ehcache + redis 技术介绍
查看>>
Write Your Own Gemspec
查看>>
PlaNet,使用图像输入来学习世界模型
查看>>
Oracle 字符集的查看和修改【下】
查看>>
nginx + keepalive
查看>>
我的友情链接
查看>>
Java运行时数据区域划分
查看>>
整个天龙八部里面,真正的英雄只有一个,真正的女人只有两个。。。
查看>>