鱼C论坛

 找回密码
 立即注册
查看: 1706|回复: 2

[技术交流] 《零基础入门学习Python》029文件:一个任务

[复制链接]
发表于 2017-7-30 19:16:16 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 1137381680 于 2017-7-30 19:18 编辑

《零基础入门学习Python》
——学习笔记

029文件:一个任务

由于这一节采用操作的形式来讲解文件用法,那我就具体讲解一下这节课各处代码的用途,以供大家能看明白。

首先我们来看一下要求:

•        任务:将文件(record.txt)中的数据进行分割并按照以下规律保存起来:
–        小甲鱼的对话单独保存为boy_*.txt的文件(去掉“小甲鱼:”)
–        小客服的对话单独保存为girl_*.txt的文件(去掉“小客服:”)
–        文件中总共有三段对话,分别保存为boy_1.txt, girl_1.txt,boy_2.txt, girl_2.txt, boy_3.txt, gril_3.txt共6个文件(提示:文件中不同的对话间已经
使用“==========”分割)

然后我们再看一下代码:
  1. f = open('record.txt')

  2. boy = []
  3. girl = []
  4. count = 1

  5. for each_line in f:
  6.     if each_line[:6] != '======':
  7.         (role, line_spoken) = each_line.split(':', 1)
  8.         if role == '小甲鱼':
  9.             boy.append(line_spoken)
  10.         if role == '小客服':
  11.             girl.append(line_spoken)
  12.     else:
  13.         file_name_boy = 'boy_' + str(count) + '.txt'
  14.         file_name_girl = 'girl_' + str(count) + '.txt'

  15.         boy_file = open(file_name_boy, 'w')
  16.         girl_file = open(file_name_girl, 'w')

  17.         boy_file.writelines(boy)
  18.         girl_file.writelines(girl)

  19.         boy_file.close()
  20.         girl_file.close()

  21.         boy = []
  22.         girl = []
  23.         count += 1

  24. file_name_boy = 'boy_' + str(count) + '.txt'
  25. file_name_girl = 'girl_' + str(count) + '.txt'

  26. boy_file = open(file_name_boy, 'w')
  27. girl_file = open(file_name_girl, 'w')

  28. boy_file.writelines(boy)
  29. girl_file.writelines(girl)

  30. boy_file.close()
  31. girl_file.close()

  32. f.close()
复制代码

首先我们先选择好要打开的文件

f = open('record.txt')

为了把内容保存到boy&girl的txt文件中,我们先创建两个空列表

boy = []
girl = []

这里的count = 1暂时先不提,一会说。

接下来由于我们要对整个文本中的内容进行逐条筛选,所以需要进行遍历,在这里我们使用for...in进行实现

for each_line in f:
    if each_line[:6] != '======':

第一行不必多说,看第二行的each line[:6],这个是什么意思呢?记性好的朋友可能想起来了,对啦,这个就是列表分片,在第十一节课程里有讲解,在这里我放一下定义。
列表分片:将一个列表中的部分元素通过分片形成一个新的包含这些元素的列表,且原列表不发生改变。括号中的冒号前是初始位置,冒号后的是结束位置,其生成的新列表不包含结束位置的那个元素。所以each line[:6]的意思就是每次遍历内容的前六个。

(role, line_spoken) = each_line.split(':', 1)
        if role == '小甲鱼':
            boy.append(line_spoken)
        if role == '小客服':
            girl.append(line_spoken)

这段代码里,大家要注意的是第一行的格式,如果看不懂的话我们可以分开来看。首先先看等号后边的each line.split(’:’,1)这句,这句的含义就是把遍历的那句话作为字符串,用split进行切片(split方法在第十四节中有)。把“:”作为分隔符,只进行一次以“:”为分隔符的分割。(大家如果这里看不明白去我的淘贴中的第十四节中看应该就会明白啦)之后再看前面,由于已经把冒号的前后分开了,那么(role, line_spoken)就相当于把冒号前的东西赋值给role,冒号后的东西赋值给line spoken。如果冒号前的是小甲鱼则把内容往boy中添加,小客服则把内容向girl中添加。至于对话中如果出现冒号怎么办?因为设定的次数为1次,所以只会分片第一个冒号。

else:
        file_name_boy = 'boy_' + str(count) + '.txt'
        file_name_girl = 'girl_' + str(count) + '.txt'

        boy_file = open(file_name_boy, 'w')
        girl_file = open(file_name_girl, 'w')

        boy_file.writelines(boy)
        girl_file.writelines(girl)

        boy_file.close()
        girl_file.close()

这段代码中,由于我们分隔的文本是对话,总共有三段,每段之间都有很长的“=======”隔开,当for in遍历到这里时,会因为内容没有“:”而出错。为了使三段对话能够分开并存储到每一次的文件中,我们就要新建txt文件。这时由于每次文件名都有变更所以我们需要count这个值。

将文件名以'boy_' + str(count) + '.txt'的格式作为值,存贮到file_name_boy这个键中,同理girl的存在file_name_girl中。
光创建完文件不行,我们还需要把内容也加进去。

boy_file = open(file_name_boy, 'w')这句是以只读的形式打开新建立的boy文件,girl同理

boy_file.writelines(boy)这句是把分离出来的文本加入到创建的文件中。(writelines就是把括号中的内容加入到文件中。由于boy和girl是我们最开始创建的空列表,之后用遍历往里加入了所要的内容,这样把boy或girl加入进去就可以完成要求)

当然,最后不要忘记最重要的一步,打开文件做了修改之后一定要关闭。boy_file.close()  girl_file.close()就是这两个。

boy = []
girl = []
count += 1

在这里由于三段对话,所以每次都要重新对boy和girl设定为空,第一次count=1,第二次count就等于2.

file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'

boy_file = open(file_name_boy, 'w')
girl_file = open(file_name_girl, 'w')

boy_file.writelines(boy)
girl_file.writelines(girl)

boy_file.close()
girl_file.close()

f.close()

这段代码在视频中其实已经讲清楚是干什么用的了,我只说下重点,就是由于第三段对话结尾不存在一堆“=======”,为了使最后一段文字也能够筛选最后加入文件,我们需要重新手动让这个筛选,建立,存入的过程再执行一次。到此整个代码解释完毕。
任务要求.JPG

评分

参与人数 1鱼币 +3 收起 理由
小甲鱼 + 3

查看全部评分

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-7-30 19:33:32 | 显示全部楼层
本帖最后由 1137381680 于 2017-7-30 19:36 编辑

容我再啰嗦几句,那个谁,把刀先放一放,说完再杀也不迟
  1. else:
  2. file_name_boy = 'boy_' + str(count) + '.txt'
  3. file_name_girl = 'girl_' + str(count) + '.txt'

  4. boy_file = open(file_name_boy, 'w')
  5. girl_file = open(file_name_girl, 'w')

  6. boy_file.writelines(boy)
  7. girl_file.writelines(girl)

  8. boy_file.close()
  9. girl_file.close()
复制代码
在这里的第一行, 'boy_' + str(count) + '.txt'这块,为什么要把count加上str转换为字符串格式呢?因为boy_已经用引号印上了,本身就是字符串嘛,想要相加在一起就需要同样类型的数据咯,所以要加上str
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-7-30 19:18:01 | 显示全部楼层
可能有的地方比较啰嗦了,但是一切是为了看懂为目的嘛。为了不懂的朋友们,做的啰嗦了些请不要见怪哈!重点我用不同颜色的都标注了,还是不懂的地方可以在帖子里问哦,一起学习。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 06:40

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表