焦点热门:python文件数据分析治理提取
目录
前提提要要求思路代码运行结果分析1)读取文件2)读取数据3)数据整理4)正则表达式匹配外加数据去重6)数据导出保存前提提要
python2.0有无法直接读取中文路径的问题,需要另外写函数。python3.0在2018年的时候也无法直接读取。
现在使用的时候,发现python3.0是可以直接读取中文路径的。
【资料图】
需要自带或者创建几个txt文件,里面最好写几个数据(姓名,手机号,住址)
要求
写代码的时候最好,自己设几个要求,明确下目的:
需要读取对应目录路径的所有对应文件按行读取出每个对应txt文件的记录使用正则表达式获取每行的手机号将手机号码存储到excel中思路
1)读取文件2)读取数据3)数据整理4)正则表达式匹配5)数据去重6)数据导出保存代码
import glob import re import xlwt filearray=[] data=[] phone=[] filelocation=glob.glob(r"课堂实训/*.txt") print(filelocation) for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data) combine_data=sum(data,[]) print(combine_data) for a in combine_data: data1=re.search(r"[0-9]{11}",a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone)) #存到excel中 f=xlwt.Workbook("encoding=utf-8") sheet1=f.add_sheet("sheet1",cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save("phonenumber.xls")
运行结果
会生成一个excel文件
分析
import glob import re import xlwt
globe用来定位文件,re正则表达式,xlwt用于excel
1)读取文件
filelocation=glob.glob(r"课堂实训/*.txt")
指定目录下的所有txt文件
2)读取数据
for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)
将路径下的txt文件循环读取,按序号依次读取文件
打开每一次循环对应的文件
将每一次循环的txt文件的数据按行读取出来
使用append()方法将每一行的数据添加到data列表中
输出一下,可以看到将几个txt的文件数据以字列形式存在同一个列表
3)数据整理
combine_data=sum(data,[])
列表合并成一个列表
4)正则表达式匹配外加数据去重
print(combine_data) for a in combine_data: data1=re.search(r"[0-9]{11}",a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))
set()函数:无序去重,创建一个无序不重复元素集
6)数据导出保存
#存到excel中 f=xlwt.Workbook("encoding=utf-8") sheet1=f.add_sheet("sheet1",cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save("phonenumber.xls")Workbook("encoding=utf-8"):设置工作簿的编码add_sheet("sheet1",cell_overwrite_ok=True):创建对应的工作表write(x,y,z):参数对应行、列、值
到此这篇关于python文件数据分析治理提取的文章就介绍到这了,更多相关python文件数据分析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1联想拯救者Y70发布最新预告:售价2970元起 迄今最便宜的骁龙8+旗舰
- 2亚马逊开始大规模推广掌纹支付技术 顾客可使用“挥手付”结账
- 3现代和起亚上半年出口20万辆新能源汽车同比增长30.6%
- 4如何让居民5分钟使用到各种设施?沙特“线性城市”来了
- 5AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 6转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 7充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 8好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 9名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 10亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战