HBase笔记整理(二)
逻辑结构 RowKey第一位 ColumnFamily ColumnQuiauer value(TimeStamps) Cell 物理结构 HMaster —–>NameNode 管理节点,用于管理HBase中的Ta...
逻辑结构 RowKey第一位 ColumnFamily ColumnQuiauer value(TimeStamps) Cell 物理结构 HMaster —–>NameNode 管理节点,用于管理HBase中的Ta...
行列式数据库 行式数据库: 可以简单的理解为类似传统的rdbmspaint这些数据,存放的数据都是结构化的数据。 行式数据库,是有利于全表数据的扫描,不利于只查询个别字段 列式数据库: 对行式数据库的一个改进,将部分列(或者说有关联的一些列...
Hive的函数 Hive函数分类 函数的定义和java、mysql一样,有三种。 UDF(User Definition Function 用户定义函数) 一路输入,一路输出 sin(30°)=1/2 UDAF(User Definitio...
Hive中表的分类 managed_table—受控表、管理表、内部表 表中的数据的生命周期/存在与否,受到了表结构的影响,当表结构被删除的,表中的数据随之一并被删除。 默认创建的表就是这种表。 可以在cli中通过desc extended...
Hive Hive由facebook贡献给Apache,是一款建立在Hadoop之上的数据仓库的基础框架。 数据仓库 特点——关于存放在数据仓库中的数据的说明: 是能够为企业的各个级别的决策提供数据支撑的数据 其实说白了,就是一个存放数据的...
package com.uplooking.bigdata.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import o...
前言 Hadoop单机版本的环境搭建比较简单,这里总结一下。 Centos基本配置 网络配置 IPADDR=192.168.43.101 NETMASK=255.255.255.0 GATEWAY=192.168.43.2 DNS1=202...
Hadoop分布式HA的安装部署 前言 单机版的Hadoop环境只有一个namenode,一般namenode出现问题,整个系统也就无法使用,所以高可用主要指的是namenode的高可用,即存在两个namenode节点,一个为active状...
为了方便知识的管理,把zk归到hadoop知识中来进行整理。 zookeeper基础知识 zookeeper概述 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现, 是Hadoo...
HDFS(Hadoop Distributed File System):分布式存储 NameNode 是整个文件系统的管理节点。它维护着整个文件系统的文件目录树,文件/目录的 元信息和每个文件对应的数据块列表。接收用户的操作请求。 文件包...