博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive调用python处理本地文件
阅读量:3903 次
发布时间:2019-05-23

本文共 652 字,大约阅读时间需要 2 分钟。

  1. .在python编译器中写python文件(本次操作是处理电话号码的数据混乱问题):
import sysfor line in sys.stdin:     for word in line:                if ord(word)<48 or ord(word)>57:                        line=line.replace(word,'')     if len(line)==12:          line=line[1:12]    else:          line=line[0:11]         print(line)
  1. 然后,在FZ中操作本地文件到hive的环境中
    在这里插入图是是片描述
    3.在对应的环境中添加python文件到hdfs:
    在这里插入图片描述
hadoop fs -put /home/hive/data/delete_not_number1.py hdfs://yilihdptest/tmp/delete_not_number1.py
  1. 调用hdfs中的python 文件:
add file hdfs://yilihdptest/tmp/delete_not_number1.py;selectTRANSFORM (exchgOrder.TeleNum)USING 'python delete_not_number1.py'  AS (rcv_tele)FROM sdata_full.CRM_PNT_ExchangeOrder exchgOrder

转载地址:http://jpoen.baihongyu.com/

你可能感兴趣的文章
TTL电平、CMOS电平、RS232电平的区别
查看>>
c语言那些细节之a+1和&a+1的区别
查看>>
交换两个变量的值,不使用第三个变量的四种法方
查看>>
STM32 产生随机数
查看>>
MFC 动态曲线 支持缩放 显示图例(CStatic派生类)
查看>>
STM32 变量存储问题
查看>>
win7下安装纯净版XP
查看>>
C++矩阵处理工具——Eigen
查看>>
CMake入门指南
查看>>
QT5.2新版本+VS2010平台搭建图文教程
查看>>
Ubuntu12.04 无线图标不显示 解决办法
查看>>
Ubuntu常用软件
查看>>
ubuntu 下 codeblocks 的使用 各种技巧转自
查看>>
win7下 背景色更改为护眼颜色
查看>>
最小二乘法拟合圆公式推导及vc实现
查看>>
Google搜索使用技巧
查看>>
【HTML】网页中嵌入视频
查看>>
日行一善的100种方式
查看>>
pdflatex插入EPS格式图片的两种方法
查看>>
在博客中用latex写公式
查看>>