[Python] python中读取txt文件时split()函数的妙用

1873 1
黑夜隐士 2022-11-6 10:06:16 | 显示全部楼层 |阅读模式
目录

    txt测试文件中的数据如下我们尝试以下代码正确地做法如下方法一:将数据以二维列表形式读入方法二:将数据以二维数组形式读入

不知道大家有没有过需要从txt文件中读取含有多行多列的数据的经历,当我们读入数据时,数据会以string的形式被读入,然而如何进行数据类型转换就成了大的问题。
这里介绍一种最简单的方式和容易产生的错误使用方法。

txt测试文件中的数据如下



我们使用如下代码读取文件,使用readlines()一次性将所有数据全部读取。
  1. with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
  2.     all_data = f.readlines()
  3.     print(all_data)
  4. # ['6.317438621610765E-05  6.123920173773844E-05  0.00010382572761752979\n', '0.00010819194873178063  8.848784016828921E-05  0.0002043378699454479\n', '9.79660835582763E-05  9.750829986943346E-05  0.00021506758227284687']
复制代码
我们不难发现这时我们的所有数据都被读入了同一行,但是内部有三个单引号括起来的部分,与我们测试数据中的三行吻合。
我们也可以看到,我们需要将这些数据分成单独的string,然后我们就可以使用例如float关键字对这些数据进行类型转换。
我们看到数据之间是通过空格来分开的。我们第一时间想到我们应该使用.split(" ")方法以空格将数据分开。

我们尝试以下代码
  1. with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
  2.     all_data = f.readlines()
  3.     all_data = all_data[0].split(" ")
  4.     print(all_data)
  5. # ['6.317438621610765E-05', '', '6.123920173773844E-05', '', '0.00010382572761752979\n']
复制代码
首先我们需要选取第一行,使用all_data[0],然后再使用split(" ")函数分开它们。
我们成功达到了目的,但是我们同时引入了""空字符串项和末尾处\n的隐患,很是棘手。
这么做我们就进入了误区。

正确地做法如下
  1. with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
  2.     all_data = f.readlines()
  3.     all_data = all_data[0].split()
  4.     print(all_data)
  5. # ['6.317438621610765E-05', '6.123920173773844E-05', '0.00010382572761752979']
复制代码
我们使用split()函数时不添加任何参数,这样就一次性去掉了""空字符串项和末尾处\n的隐患还同时分开了各个字符串。
如果需要输出多行的结果,我们可以预先定义一个数组,用来存放我们的数据,完整代码如下:(以后所有的多行多列数据均可以如此读入)

方法一:将数据以二维列表形式读入
  1. array2d = []
  2. with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
  3.     all_data = f.readlines()
  4.     for i in range(len(all_data)):
  5.         temp_list = []
  6.         for element in all_data[i].split():
  7.             temp_list.append(float(element))
  8.         array2d.append(temp_list)
  9. print(array2d)
  10. #[[6.31743862e-05, 6.12392017e-05, 0.000103825728],
  11. # [0.000108191949, 8.84878402e-05, 0.00020433787],
  12. # [9.79660836e-05, 9.75082999e-05, 0.000215067582]]
复制代码
方法二:将数据以二维数组形式读入
  1. import numpy as np
  2. array = np.zeros((3, 3))
  3. with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
  4.     all_data = f.readlines()
  5.     for i, line in enumerate(all_data):
  6.         numbers = line.split()
  7.         for j, element in enumerate(numbers):
  8.             array[i, j] = float(element)
  9. print(array)
  10. # [[6.31743862e-05 6.12392017e-05 1.03825728e-04]
  11. #  [1.08191949e-04 8.84878402e-05 2.04337870e-04]
  12. #  [9.79660836e-05 9.75082999e-05 2.15067582e-04]]
复制代码
以上为个人经验,希望能给大家一个参考,也希望大家多多支持中国红客联盟。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

中国红客联盟公众号

联系站长QQ:5520533

admin@chnhonker.com
Copyright © 2001-2025 Discuz Team. Powered by Discuz! X3.5 ( 粤ICP备13060014号 )|天天打卡 本站已运行