最近需要抽取csv文件中的特定列,使用excel老是将hh.mm.ss.SSS格式数据搞坏,于是想通过python直接提取。方法记录如下:
环境配置
Pandas介绍
Pandas是用于数据操纵和分析的Python软件库。它建造在NumPy基础上,并为操纵数值表格和时间序列,提供了数据结构和运算操作。
依赖环境
- python 3.8.5,可在windows7上运行,python 3.9以后版本不支持windows7
- numpy==1.24.4
- pandas==2.0.3
- python-dateutil==2.9.0.post0
- pytz==2024.1
- six==1.16.0
- tzdata==2024.1
虚拟环境
1 | mkdir csv_extract |
离线迁移
创建envConfig.bat批处理文件,一键执行离线环境配置。
1 | python -m venv env |
具体实现
1 | import pandas as pd |
参考链接
- pandas,by pandas.
- How to Recursively Traverse Files and Directories in Python,by Sabahat Khan.
- Pandas读取CSV的时候报错文件不存在的经验小记,by 翻滚的小@强.
- Python os.walk() 方法,by runoob.