Hadoop - Akiraka

Hadoop

CentOS 安装 HaDoop 2.10.1 伪分布式 + Hive 3.1.2 + Spark 2.4.8

一、准备 1.1、介绍名称版本说明 centos 7.9 随便无所谓 openjdk 1.8.0_291 版本1.8x即可 hadoop 2.10.1 版本自己看着办 spark 2.4.8 版本自……

2021-06-16 Akiraka

2 0

Hadoop

SPARK 命令行读取 parquet 数据

查看 HDFS 数据 [root@node-master]# hadoop fs -ls / Found 12 items drwxrwxrwx - hdfs hadoop 0 2020-11-24 17:59 /app-logs drwxrwxrwx ……

2020-12-08 Akiraka

0 0

Hadoop

本地文件拷贝到 HDFS

创建文件夹： hadoop fs -mkdir /work 拷贝： hadoop fs -put /Users/yp/Documents/test.txt /work 命令列出所有文件： hadoop fs -ls /文件夹名称删除文件……

2020-12-08 Akiraka

0 0

Hadoop

大数据环境 Pyenv 搭建

一、准备 1.1、介绍名称版本说明 centos 7.9 随便无所谓 openjdk 1.8.0_291 版本1.8x即可 hadoop 2.10.1 版本自己看着办 1.2、机器规格 C……

2020-02-11 Akiraka

0 0

Hadoop

jdk Hadoop Spark Hive Zookeeper环境变量

下载地址：http://mirrors.linuxeye.com/jdk/jdk-8u231-linux-x64.tar.gz # 编辑 profile vim /etc/profile # JDK export JAVA_HOME=/usr/java/jdk1.8.0_23……

2020-02-09 Akiraka

0 0

Hadoop

CDH Spark 设置python版本

配置好重启 spark服务即可

2020-02-09 Akiraka

0 0

Hadoop

Spark 默认 python版本修改

# 路径 /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/bin/pyspark # 找到python 直接改就可以了

2020-02-09 Akiraka

0 0

Hadoop

hue 报错

'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) 错误描述使用中文用户名就会报错解决方法 /opt/cloudera/parcels/CD……

2020-02-09 Akiraka

0 0

Hadoop

pyspark 解决报错问题

问题描述需要切换 hdfs 用户，默认是不能登录的修改 hdfs 即可只要非管理员用户也可以 vim /etc/passwd # 原 hdfs:x:995:990:Hadoop HDFS:/var/lib/had……

2020-02-09 Akiraka

0 0

Hadoop

设置pyspark 启动时所使用的python版本

以下操作均为使用非root用户进行。指定pyspark启动时使用的python版本， vim ~/.bashrc 在文件中添加： export PYSPARK_PYTHON=/usr/local/bin/python3 指……

2020-02-09 Akiraka

0 0