我想做计算机程序的构造与解释(SICP)的教程,先在这里占个坑。
使用Modeller补缺失残基
写这个是因为每次用的时候发现都忘记了,甚至不知道网页在哪,每次都要在一堆链接中反复点击,宛如蒙特卡洛模拟,有时候甚至还找不到想要的网站。因此我现在就把使用modeller补全缺失残基的网页放在这里。
我们以4GNX为例进行补全。首先4GNX在PDB中是个二聚体结构,我们只需要其中的一半的信息,所以我们删除了X,Y,Z和L链,改文件命名为4gnx_half.pdb
。之后我们需要得到pdb中的序列信息。但是modeller只会得到存在的残基的序列。对于中间缺失的残基,虽然pdb文件的REMARK 465
中记录了缺失的残基序号和类型,pdb文件中的SEQRES
也记录了生物分子的序列信息,但是modeller并不会帮你从pdb中提取出来在序列上补充上,因为modeller认为这部分信息是不可靠的。并且有的经过处理的pdb甚至会丢失这些信息。
我们可以使用一下代码提取pdb文件中的序列信息: 1
2
3
4
5
6
7
8
9from modeller import *
# Get the sequence of the 4gnx PDB file, and write to an alignment file
code = '4gnx'
e = Environ()
m = Model(e, file=code)
aln = Alignment(e)
aln.append_model(m, align_codes=code)
aln.write(file=code+'.seq')
数学分析学习
最近发现自己的数学,在我学习随机过程的时候,我发现我并不会概率论,当我学习概率论的时候,我发现我并不会测度论,而当我学习测度论的时候,我终于发现,原来我不会数学。
想到这里,顿时豁然开朗,原来我应该从头开始学数学。
当然实际上,在我学习测度论的时候,我就发现其实我缺失的是一些最基本的数学上的概念,比如上确界和下确界,这些知识的缺失使我学习测度论的过程异常艰难。
为了补全这些知识,我决定从数学分析开始学起来。为了记住学习的知识点,我决定用费曼学习法,即写一本《数学分析讲义》。希望能在学习和写讲义的过程中有所收获。