Hadoop18

CentOS 安装 HaDoop 2.10.1 伪分布式 + Hive 3.1.2 + Spark 2.4.8
一、准备 1.1、介绍 名称 版本 说明 centos 7.9 随便无所谓 openjdk 1.8.0_291 版本1.8x即可 hadoop 2.10.1 版本自己看着办 spark 2.4.8 版...
SPARK 命令行读取 parquet 数据
查看 HDFS 数据 [root@node-master]# hadoop fs -ls / Found 12 items drwxrwxrwx - hdfs hadoop 0 2020-11-24 ...
本地文件拷贝到 HDFS
创建文件夹: hadoop fs -mkdir /work 拷贝: hadoop fs -put /Users/yp/Documents/test.txt /work 命令列出所有文件: hadoop...
大数据环境 Pyenv 搭建
一、准备 1.1、介绍 名称 版本 说明 centos 7.9 随便无所谓 openjdk 1.8.0_291 版本1.8x即可 hadoop 2.10.1 版本自己看着办 1.2、机器规格 CPU ...
jdk Hadoop Spark Hive Zookeeper环境变量
下载地址:http://mirrors.linuxeye.com/jdk/jdk-8u231-linux-x64.tar.gz # 编辑 profile vim /etc/profile # JDK ...
CDH Spark 设置python版本
配置好 重启 spark服务即可
Spark 默认 python版本修改
# 路径 /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/bin/pyspark # 找到python 直接改就可以了
hue 报错
'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) 错误描述 使用中文用户名就会报错 解决...
pyspark 解决报错问题
问题描述 需要切换 hdfs 用户,默认是不能登录的 修改 hdfs 即可 只要非管理员用户也可以 vim /etc/passwd # 原 hdfs:x:995:990:Hadoop HDFS:/va...
设置pyspark 启动时所使用的python版本
以下操作均为使用非root用户进行。 指定pyspark启动时使用的python版本, vim ~/.bashrc 在文件中添加: export PYSPARK_PYTHON=/usr/local/b...