Hadoop 面试题之Hive-白红宇

Hadoop 面试题之Hive

阅读量：5734 次

发布时间：2019-06-18

本文共 2198 字，大约阅读时间需要 7 分钟。

1.Hive 有哪些方式保存元数据，各有哪些特点。

15. Hive内部表和外部表的区别

23.hive底层与数据库交互原理

Hive的Hql语句掌握情况?

36.使用Hive或自定义mr实现如下逻辑：

product_no lac_id moment start_time user_id county_id staytime city_id 13429100031 22554 8 2013-03-11 08:55:19.151754088 571 571 282 571 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 103 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100140 26642 9 2013-03-11 09:02:19.151754088 571 571 18 571 13429100082 22691 8 2013-03-11 08:57:32.151754088 571 571 287 571 13429100189 22558 8 2013-03-11 08:56:24.139539816 571 571 48 571 13429100349 22503 8 2013-03-11 08:54:30.152622440 571 571 211 571 字段解释： product_no：用户手机号； lac_id：用户所在基站； start_time：用户在此基站的开始时间； staytime：用户在此基站的逗留时间。需求描述：根据 lac_id 和 start_time 知道用户当时的位置，根据 staytime 知道用户各个基站的逗留时长。根据轨迹合并连续基站的 staytime。最终得到每一个用户按时间排序在每一个基站驻留时长期望输出举例： 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 390 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 Linux 脚本能力考察：

59.pig latin,hive 语法有什么不同

71.hive如何调优

72.hive 如何权限控制？

74.hive能像关系数据库那样，建多个库吗？

110. hive 实现统计的查询语句是什么?

115.对比hive与mapreduce统计手机流量的区别？

HIve也问了一些，外部表，还有就是hive的物理模型跟传统数据库的不同

134.Hive元数据保存的方法有哪些，各有什么特点？

145.对于hive，你写过哪些udf函数，作用是什么？

148.hive 底层与数据库交互原理。

362.你们写hive的hql语句，大概有多少条？

364.hive 跟hbase的区别是？

379.hive 中的压缩格式RCfile .TextFile SequenceFile 各有什么区别？

以上3种格式一样大的文件哪个占用空间大小，还有hadoop中的一个HA压缩。

395.你们hive处理数据能到到的指标是多少？

408.Hive 的工作原理、两种元数据存放方式、几种表之间的区别、数据导入的几种方式、几种文件格式、UDF函数、性能调优(重点是join 的时候如何放置大小表)？

412.hive的两张表关联，使用mapreduce 是怎么写的？

提示：打标记笛卡尔乘积

413.hive 相对于oracle来说有哪些优点？

提示：hive 是数据仓库，oracle是数据库，hive 能够存储海量数据，hive还有更重要的作用就是数据分析，最主要的是免费。

472.hive优化

475.hive的sort by 和 order by 的区别

476.Hive里面用什么代替in 查询

提示：Hive中的left semi join 替换sql 中的in 操作

488.hive如何优化

549.你们用hive-15啊

转载于:https://www.cnblogs.com/chaoren399/p/4714780.html

你可能感兴趣的文章