目录
异常描述出现原因解决方案:修改自定义格式pandas直接解析Excel数值为日期总结异常描述
有时我们的Excel有一个调整过自定义格式的日期字段:
当我们用pandas读取时却是这样的效果:
不管如何指定参数都无效。
出现原因
没有使用系统内置的日期单元格格式,自定义格式没有对负数格式进行定义,pandas读取时无法识别出是日期格式,而是读取出单元格实际存储的数值。
解决方案:修改自定义格式
可以修改为系统内置的自定义格式:
或者在自定义格式上补充负数的定义:
增加;@即可
pandas直接解析Excel数值为日期
有时这种Excel很多,我们需要通过pandas批量读取,挨个人工修改Excel的自定义格式费时费力,下面我演示如何使用pandas直接解析这些数值成为日期格式。
excel中常规格式和日期格式的转换规则如下:
1900/1/1为起始日期,转换的数字是1,往后的每一天增加1
1900/1/2转换为数字是 2
1900/1/3转换为数字是 3
1900/1/4转换为数字是 4
以此类推
excel中时间转换规则如下:
在时间中的规则是把1天转换为数字是 1
每1小时就是 1/24
每1分钟就是 1/(24×60)=1/1440
每1秒钟就是 1/(24×60×60)=1/86400
根据Excel的日期存储规则,我们只需要以1900/1/1为基准日期,根据数值n偏移n-1天即可得到实际日期。不过还有个问题,Excel多存储了1900年2月29日这一天,而正常的日历是没有这一天的,而我们的日期又都是大于1900年的,所以应该偏移n-2天,干脆使用1899年12月30日作为基准,这样不需要作减法操作。
解析代码如下:
import pandas as pd from pandas.tseries.offsets import Day df = pd.read_excel("日期.xlsx") basetime = pd.to_datetime("1899/12/30") df.日期 = df.日期.apply(lambda x: basetime+Day(x)) df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日") df.head()
日期 | |
---|---|
0 | 6月8日 |
1 | 6月9日 |
2 | 6月10日 |
3 | 6月11日 |
4 | 6月12日 |
如果需要调用time的strftime方法,由于包含中文则需要设置locale:
import pandas as pd from pandas.tseries.offsets import Day import locale locale.setlocale(locale.LC_CTYPE, "chinese") df = pd.read_excel("日期.xlsx") basetime = pd.to_datetime("1899/12/30") df.日期 = df.日期.apply(lambda x: basetime+Day(x)) df.日期 = df.日期.dt.strftime("%Y年%m月%d日") df.head()
日期 | |
---|---|
0 | 2021年06月08日 |
1 | 2021年06月09日 |
2 | 2021年06月10日 |
3 | 2021年06月11日 |
4 | 2021年06月12日 |
总结
到此这篇关于PythonPandas读取Excel日期数据的异常处理的文章就介绍到这了,更多相关Pandas读取Excel日期数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 15G资费不大降!三大运营商谁提供的5G网速最快?中国信通院给出答案
- 2联想拯救者Y70发布最新预告:售价2970元起 迄今最便宜的骁龙8+旗舰
- 3亚马逊开始大规模推广掌纹支付技术 顾客可使用“挥手付”结账
- 4现代和起亚上半年出口20万辆新能源汽车同比增长30.6%
- 5如何让居民5分钟使用到各种设施?沙特“线性城市”来了
- 6AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 7转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 8充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 9好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 10名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?