鱼C论坛

 找回密码
 立即注册
查看: 2195|回复: 2

[已解决]关于python选择性阅读文本的问题

[复制链接]
发表于 2016-10-2 16:55:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
目的:给出一个fasta格式的文件,只要输入文件名就可以统计数该文件中碱基序列的A、T、C、G数量
我写的代码
  1. def ATCG_counter(seq):
  2.      a=t=c=g=0
  3.      for each in seq:
  4.           if each == 'A':
  5.                a +=1
  6.           elif each == 'T':
  7.                t +=1
  8.           elif each == 'G':
  9.                g +=1
  10.           elif each == 'C':
  11.                c +=1

  12.      print('A:%d'%(a))
  13.      print('T:%d'%(t))
  14.      print('C:%d'%(c))
  15.      print('G:%d'%(g))
  16.      print('All base:%d'%(a+t+c+g))
  17.      
  18. import os
  19. file_name = input('请输入文件名:')
  20. f = open(file_name)
  21. sequence = f.read()
  22. ATCG_counter(sequence)
复制代码

问题:fasta格式文件的第一行是这段序列的基本信息,之后才是序列碱基,但是使用这段代码会使第一行的代码信息中的字母被误以为是碱基,造成统计误差,该如何修改这段代码?
bty 求大神给看看这段代码有何改进之处
最佳答案
2016-10-2 17:57:35
好在每行最后有换行符,可以把文件读取作为列表,再用列表切片,去掉第一行。
  1. f = open('t.txt')
  2. seq = list(f)
  3. seq = seq[1:]
  4. print(seq)
  5. f.close()
复制代码

新建文本文档.txt

5.64 KB, 下载次数: 2

想要统计的序列 第一行是序列信息

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-10-2 17:57:35 | 显示全部楼层    本楼为最佳答案   
好在每行最后有换行符,可以把文件读取作为列表,再用列表切片,去掉第一行。
  1. f = open('t.txt')
  2. seq = list(f)
  3. seq = seq[1:]
  4. print(seq)
  5. f.close()
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-10-6 11:33:44 | 显示全部楼层
冬雪雪冬 发表于 2016-10-2 17:57
好在每行最后有换行符,可以把文件读取作为列表,再用列表切片,去掉第一行。

好的 我去试试  谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-27 00:50

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表