
Hadoop笔记整理(一):Hadoop概述
大数据概述 大数据 两个方面 数据体积 bit,byte,kb,mb,gb,tb,pb,eb,zb,nb,db,yb 处理方式 存储问题 数据体积比较大的时候不适合进行集中式的存储,转而使用分布式的存储 集中式存储 一个完整的数据都存储在一...
大数据概述 大数据 两个方面 数据体积 bit,byte,kb,mb,gb,tb,pb,eb,zb,nb,db,yb 处理方式 存储问题 数据体积比较大的时候不适合进行集中式的存储,转而使用分布式的存储 集中式存储 一个完整的数据都存储在一...
Flume简介 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的...
Alpine Linux开启SSH远程登陆 简介: 最重要的一个服务了,远程登陆需要用它,文件传输需要用它,必备功能。不管你是在实体机上跑,虚拟机上跑,docker里面跑,这个都是必须的。 配置 配置文件位置: /etc/ssh/sshd_...
画图必备的图标,放出来共享一下。 请用PS打开后将图标取出,图标是透明高清的。 链接:https://pan.baidu.com/s/1i_tiogqUoLxAfN5yAjcmyw 提取码:h1vz
for i in range(1,10): for j in range(i,10): print('%s*%s=%s'%(i,j,i*j),end="\t") print("\r") for i in range(9,-1,-1): fo...
python对字符串的表示方法比c更有灵活性,但是也更难理解。 为了在平时使用、看代码过程中对着单引号(‘)、双引号(“)、三引号(”’,”””)不混淆,知...
运营反馈 Nginx 报 400 错误,具体点说:Request Header Or Cookie Too Large。其实随便搜搜就知道可以通过加大 client_header_buffer_size 和 large_client_hea...
准备知识 1.我们所执行的任何程序,都是由父进程(parent process)所产生出来的一个子进程(child process),子进程在结束后,将返回到父进程去。此一现像在Linux系统中被称为 fork。当子进程被产生的时候,将会从...
Shell中并没有真正意义的多线程,要实现多线程可以启动多个后端进程,最大程度利用cpu性能。 直接看代码示例吧。 (1) 顺序执行的代码 #!/bin/bash date for i in `seq 1 5` do { echo "sle...
shell远程执行: 经常需要远程到其他节点上执行一些shell命令,如果分别ssh到每台主机上再去执行很麻烦,因此能有个集中管理的方式就好了。一下介绍两种shell命令远程执行的方法。 前提条件: 配置ssh免密码登陆 对于简单的...