306-215-7706

提取奇数行:
f=open(‘C:/Users/liuw/Downloads/rosalind_ini5.txt’,’r’)
i=1
for line in f:
if i%2==1:
print(line)
i+=1
算互补连:
#f=open(‘C:/Users/liuw/Downloads/rosalind_revc (4).txt’)
#s=f.readline() #和readlines不同
s=’AAATACCCGGT’
k=s[::-1]
for letter in k:
if letter==’A':
letter=T
elif letter==’T':
letter=A
elif letter==’G':
letter=’C’
elif letter==’C':
letter=’G’
else:
pass
print(letter,end=”)
兔子繁殖问题 递归问题
n=input(“n is:\n”)
k=input(“k is:\n”)
#dynamic programming
f_seq=[1,1];
bool_list=[1,1,0];
for i in range(2,int(n)):
if(bool_list[i]==0):
f_seq.append(f_seq[i-1]+int(k)*f_seq[i-2])
bool_list[i]=1
bool_list.append(0)
i+=1;
else:
bool_list.append(0)
i+=1;
print(f_seq[int(n)-1]);

pip:Enter the command within cmd console not python shell
每个字后面插入一个空格:查找内容:?替换为:^&空格 (键盘空格键输入空格,想输几个都行)高级选项勾选使用通配符,全部替换。插入白色或透明小字体

/www.ibm.com/developerworks/cn/opensource

/docs.python.org/3/tutorial/index.html

/developers.google.com/edu/python/exercises/basic

/www.jianshu.com/p/938d362fc48d

/www.pythontutor.com/visualize.html#mode=edit

/open.163.com/special/opencourse/bianchengdaolun.html

/rosalind.info/problems answers:/github.com/mtarbit/Rosalind-Problems/blob/master/e004-gc.py

/www.fullstackpython.com/

qq在线象棋/web.3366.com/xq/

/www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/

/study.163.com/course/courseMain.htm?courseId=320022

/awesome-r.com/

/www.statmethods.net/management/reshape.html R资源
www.dnalc.org
/www.stat.cmu.edu/~cshalizi/402/ R本科学习课程
图书馆资源要从常用数据库那个链接进去

名句,格言

夫夷以近,则游者众;险以远,则至者少。而世之奇伟、瑰怪,非常之观,常在于险远,而人之所罕至焉,故非有志者不能至也

有用的网址 网址 链接 在线分析工具等

文件,ftp资源的搜索引擎

/www.filewatcher.com/

/filemare.com/zh-cn

最快谷歌ip查找工具

/asm.ca.com/en/ping.php

韦恩图Venn: /bioinformatics.psb.ugent.be/webtools/Venn/
统计软件使用/www.ats.ucla.edu/stat/seminars/default.htm

数据
/sites.google.com/a/ualberta.ca/onekp/ 1000plants
/signal.salk.edu/atg1001/index.php /1001genomes.org/ 1001arbidopsis
GEO data download methods:/www.ncbi.nlm.nih.gov/geo/info/download.html;/www.ncbi.nlm.nih.gov/geo/download/?acc=GSM174668&format=file

教学 资源:

/teachingresources.pnas.org/

/undsci.berkeley.edu/teaching/

/evolution.berkeley.edu/evolibrary/article/phylogenetics_02

/ocw.mit.edu/index.htm

/teachlearn.caltech.edu/Technology/online

/crosstalk.cell.com/blog/topic/biology-in-3d

/www.nature.com/scitable

/www.sciencemag.org/topics

核心期刊sci查询 /coreej.cceu.org.cn/
How to use Weka Packages in R?
Setting WEKA_HOME global variable as Users\’username’\wekafiles
and make model like this
Elastic <- make_Weka_classifier(‘weka/classifiers/functions/ElasticNet’,
c(‘ElasticNet’, ‘Weka_functions’),
init = make_Weka_package_loader(‘elasticNet’))
LBR <- make_Weka_classifier(“weka/classifiers/lazy/LBR”,
c(‘LBR’, ‘Weka_lazy’),
init=make_Weka_package_loader(“lazyBayesianRules”))

2672353085

a list of experiments (SRX);run (SRR) in the experiment;The SRX/ERX/DRX links go to an experiment report page

/www.ncbi.nlm.nih.gov/books/NBK56913/#search.each_srx_entry_in_the_entrez_sra

/zhuanlan.zhihu.com/p/20731723

fastq-dump是SRAToolkit下的工具能够转换sra数据成fastq/fasta格式的文件
1、下载和安装SRAToolkit工具包 apt install sratoolkit
wget “/ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz”
tar xzf sratoolkit.current-centos_linux64.tar.gz
或者:

/www.ncbi.nlm.nih.gov/Traces/sra/?view=software

有详细介绍
安装RNA-SEQ软件
查看源sudo gedit /etc/apt/sources.list
没有的话,添加1行deb /us.archive.ubuntu.com/ubuntu vivid main multiverse
更新:sudo apt-get update
安装:sudo apt-get install cufflinks #其他包bowtie2,tophat按apt-get这个直接可以安装
2、转换 .sra 文件成 .fastq/fasta 文件
#single-end
…/fastq-dump …/SRR***.sra -O out_path
…/fastq-dump –fasta …/SRR306998.sra -O out_path
#pair-end
…/fastq-dump –split-3 …/SRR***.sra -O out_path
速度慢是因为拷贝的/bin下了,请在原软件包路径运行,输出文件的路径需要设置一下。批量处理sra为fastq代码
#!/bin/sh
for i in DRR019484 DRR019485;
do mkdir $i
fastq-dump $i.sra
mv $i.sra $i
mv $i.fastq $i
done

Python下的大多数工具包安装都很简单,只需要执行 “python setup.py install xxx”命令即可
sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose
hisat2安装/hub.docker.com/r/limesbonn/hisat2/~/dockerfile/
人/小鼠数据:/www.gencodegenes.org/releases/19.html#
修复错误环境路径export PATH=/usr/local/bin:/bin:/usr/bin:/sbin:/usr/sbin:
免安装包:cp -p hisat2 hisat2-* /usr/local/bin #stringtie类似安装方法
参考/wp.zxzyl.com/?p=172

质控:去接头、去低质量样本、去低质量reads、去barcodes or noise
fastqc看质量情况/insidedna.me/tutorials/view/fastqc-quality-control-and-filtering-of

/insidedna.me/tutorials/view/trimmomatic-reads-cleaning-and-filtering-is

/onetipperday.sterding.com/2012/08/three-ways-to-trim-adaptorprimer.html

ls * |grep “fq”|perl -lne’s/.1.fq/g;s/.2.fq/g;print’ | sort |uniq | perl -lne ‘print” java -jar /home/bioinfo/Downloads/Trimmomatic-0.36/trimmomatic-0.36.jar PE -threads 128 ${_}.1.fq ${_}.2.fq ${_}_output_forward_paired ${_}_output_forward_unpaired ${_}_output_reverse_paired ${_}_output_reverse_unpaired ILLUMINACLIP:/home/bioinfo/Downloads/Trimmomatic-0.36/adapters/mine:2:30:10 LEADING:20 TRAILING:20 SLIDINGWINDOW:4:20 MINLEN:85 “‘>trimmomatic.sh;
sh trimmomatic.sh #批量处理
sudo apt-get install fastx-toolkit
Available Tools
FASTQ-to-FASTA converter
Convert FASTQ files to FASTA files.
FASTQ Information
Chart Quality Statistics and Nucleotide Distribution
FASTQ/A Collapser
Collapsing identical sequences in a FASTQ/A file into a single sequence (while maintaining reads counts)
FASTQ/A Trimmer
Shortening reads in a FASTQ or FASTQ files (removing barcodes or noise).
FASTQ/A Renamer
Renames the sequence identifiers in FASTQ/A file.
FASTQ/A Clipper
Removing sequencing adapters / linkers
FASTQ/A Reverse-Complement
Producing the Reverse-complement of each sequence in a FASTQ/FASTA file.
FASTQ/A Barcode splitter
Splitting a FASTQ/FASTA files containning multiple samples
FASTA Formatter
changes the width of sequences line in a FASTA file
FASTA Nucleotide Changer
Convets FASTA sequences from/to RNA/DNA
FASTQ Quality Filter
Filters sequences based on quality
FASTQ Quality Trimmer
Trims (cuts) sequences based on quality
FASTQ Masker
Masks nucleotides with ‘N’ (or other character) based on quality
fastx_trimmer [-h] [-f N] [-l N] [-z] [-v] [-i INFILE] [-o OUTFILE] -f N:起始碱基位置(-f 13),-l N:终止碱基位置90,批量类似

/www.cnblogs.com/xudongliang/p/5081518.html

hisat2流程:hisat2-build genome.fa rice -p 128; hisat2 -q -x rice -1 *._1.fq -2 *._2.fq -S *.sam -p 128; samtools view -Su *.sam | samtools sort – *.sorted
stringtie alns.sorted.bam -b stringtie_input_dir -e -G hg19.annotation.gtf -C cov_ref.gtf -p 128 -o stringtie.out.gtf
#stringtie alns.sorted.bam -b stringtie_input_dir -e -G hg19.annotation.gtf -p 128 -o stringtie.out.gtf -A abundance.csv
# -B This switch enables the output of Ballgown input table files (*.ctab) containing coverage data for the reference transcripts given with the -G option. or -b Just like -B this option enables the output of *.ctab files for Ballgown
# -e Limits the processing of read alignments to only estimate and output the assembled transcripts matching the reference transcripts given with the -G option
# -C StringTie outputs a file with the given name with all transcripts in the provided reference file that are fully covered by reads (requires -G).
在-b 指定的文件夹下生成特定的文件
每个样本先运行一次stringtie,以GRCh38作为注释文件,生成各自拼接的转录本,
把每个生成的转录本合并成一个完整的转录本,代表着在整个测序过程中出现的所有的转录本。在这之前,需要先自己新建一个文本文件assemblies.txt,记录每个转录本的位置,如图所示:
运行命令:-g代表着GRCh38,-s代表着参考基因组,最后即我们的位置文件。
cuffmerge -g ${gtfFile} -s ${genomeFile} -p 25 -o ${outFile} assemblies.txt
再一次运行stringtie。这里有一点需要注意的是,生成结果的目录结构:一个样本的结果单独放在一个目录下。准备好之后,运行:
stringtie ${file} -p 25 -G merged.gtf -o ${output} -B -e
这里需要注意的是注释文件的改变。-B参数用来生成后续软件(如ballgown)所需文件,-e参数表示只对参考注释文件中的转录本进行定量。
上一步生成的结果文件,可以直接导入ballgown里面直接运行。ballgown是R bioconductor包里面的一个子包,首先需要安装。
source(“/bioconductor.org/biocLite.R”)
biocLite(“ballgown”)
如果安装失败,多是可能你的bioconductor包需要更新,更新命令如下:
source(“/bioconductor.org/biocLite.R”)
biocLite()
Rcurl安装出问题需要安装下面的:
sudo apt-get build-dep libcurl4-gnutls-dev
apt-get -y install libcurl4-gnutls-dev
更新之后,再次安装,即可。安装完成之后,运行命令如下:​
library(ballgown)
bg = ballgown(dataDir=’second-step-gtf/cen-edg’, samplePattern=’sample’, meas=’all’)​
transcript_fpkm = texpr(bg, ‘FPKM’)​
transcript_cov = texpr(bg, ‘cov’)​
whole_tx_table = texpr(bg, ‘all’)
exon_mcov = eexpr(bg, ‘mcov’)​
junction_rcount = iexpr(bg)​
whole_intron_table = iexpr(bg, ‘all’)​​​
基因表达=gexpr(bg)
#这里我每个样本有3个重复
pData(bg) = data.frame(id=sampleNames(bg), group=rep(c(1,0), each=3))
phenotype_table = pData(bg)
#评估以FPKM评估gene的表达量stat_results = stattest(bg, feature=’gene’, meas=’FPKM’, covariate=’group’, getFC = TRUE)
head(stat_results)#结果输出到文件中write.table(stat_results,“second-step-gtf/cen-adj/DE.txt”)
结果说明:
ballgown最终的结果并没有得到相应差异表达基因。因此想换另一种差异表达分析包,如DESeq2。但是从stringtie中,无法得到每个基因(甚至转录本的)的原始read counts,只能得到FPKM。因此,并不能换分析。要换的话,也得从定量开始。不过可以得到每个转录本的外显子的read counts。
/support.illumina.com/sequencing/sequencing_instruments/hiseq_2000/documentation.html 机器相关的一些使用说明

SNP检测bwa index ref.fa;bwa mem ref.fa read1.fq read2.fq > aln-pe.sam (70-1Mbp);samtools view -bS test.sam | samtools sort – *.sorted;samtools index bwa.bam;samtools mpileup -f ref.fa bwa.bam | head;gatk -T HaplotypeCaller -R ref.fa -I bwa1.bam -o gatk.vcf
snp下载ftp:/ftp.ncbi.nih.gov/snp/organisms/
SNP检测方法:/www.jianshu.com/p/938d362fc48d
批量解压sra文件
for i in *sra
do
echo $i
/home/jmzeng/bio-soft/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump –split-3 $i
done

/indexofire.gitbooks.io/notebook_of_analyzing_pathogen_ngs_data/content/chapter_1/sra.html

/www.whyes.org/

Velvet1.2.10的安装和使用 /www.cnblogs.com/xianghang123/archive/2014/02/10/3543082.html
基因组测序、组装与分析总结 /www.cnblogs.com/leezx/p/5577600.html
基因组组装流程 /www.cnblogs.com/leezx/p/5577600.html
很多好资源:/chagall.med.cornell.edu/RNASEQcourse/
kallisto::kallisto index -i genomerice.fa genome.fa;kallisto quant -i index -o output pairA_1.fastq pairA_2.fastq pairB_1.fastq pairB_2.fastq
注意路径是否为绝对路径,对于单端数据还要-l,-s等2个参数,Cufflinks可以对着2个参数做出估计
本地blast服务器:/www.sequenceserver.com/#installation-and-configuration
Jbrowser: apt-get install nginx; /var/www/html为根目录;cd JBrowse-1.12.1;./setup.sh;sudo mv * /var/www/html/

/www.trii.org/courses/

/abc.med.cornell.edu/education/introtobio/

/mezeylab.cb.bscb.cornell.edu/Classes.aspx

/simons.berkeley.edu/events/openlectures

/www.majorbio.com/sequenceGuide.html

/services.cbib.u-bordeaux.fr/galaxy/

pressure

Ubuntu 14.04远程登录服务器–ssh的安装和配置
1更新源列表:打开”终端窗口”,输入”sudo apt-get update”–>回车–>”输入当前登录用户的管理员密码”–>回车,就可以了。
2.安装ssh:打开”终端窗口”,输入”sudo apt-get install openssh-server”–>回车–>输入”y”–>回车–>安装完成。
3.查看ssh服务是否启动:打开”终端窗口”,输入”sudo ps -e |grep ssh”–>回车–>有sshd,说明ssh服务已经启动,如果没有启动,输入”sudo service ssh start”–>回车–>ssh服务就会启动。
4.使用gedit修改配置文件”/etc/ssh/sshd_config”
打开”终端窗口”,输入”sudo gedit /etc/ssh/sshd_config”–>回车–>把配置文件中的”PermitRootLogin without-password”加一个”#”号,把它注释掉–>再增加一句”PermitRootLogin yes”–>保存,修改成功。
或vi,:wq,Insert,delet
5.查看Ubuntu 14.04的IP地址:打开”终端窗口”,输入”sudo ifconfig”–>回车–>就可以查看到IP地址。
6.putty默认端口为22

修改Ubuntu用户名和密码
修改root密码:sudo passwd root
修改主机名:sudo vi /etc/hostname 将其中的名字改为自己的名字
sudo vi /etc/hosts
修改用户名:sudo vi /etc/passwd
找到原先的用户名,将其改为自己的用户名,但是/home/“原先用户名” 中的不能更改,若更改重启后,便登陆不了系统了。
sudo vi /etc/shadow
找到原先用户名,改为自己的用户名
以上步骤完毕后,sudo reboot重启
重启后,进入系统,发现 home 目录下用户目录还是原先用户名,但是用命令 ls -al 可以看到起用户目录所属用户已变更为你自己的用户了,下面用 “mv 用户目录名 自己的用户目录名”将目录名更改下就可以了。例如原先目录名为xxxx 现要改为用户 yyyy。用命令 mv xxxx yyyy即可。

Windows搭建SSH和SFTP(其他机器可用putty及WinSCP的Synchronize进行同步)/www.cnblogs.com/xred/archive/2012/04/21/2461627.html
/www.freesshd.com/ 下载2个软件,安装,服务会自动启动,先停掉SSH,
② 安装完成后进入配置界面(Server Status),确认SSH server正在运行状态
③ 进入Users界面,设定一个访问的用户账户(比如xut),选择Password方式,开启Shell和SFTP;注意不要点确定,或关闭窗口,否则用户会没掉(bug?)
客户端此时可以进行操作登录了.可用系统自带IIS的ftp进行。

提交ubuntu命令后台操作,非nohup,为screen
交互式进程要放到后台的话,还是用screen比较好。首先,运行screen进入终端,执行你的程序,按ctrl+a,再按d键可以暂时退出终端,当要返回时,先screen -list查看刚才的终端进程ID,然后screen -r xx(刚才的进程ID)回去控制

kylin远程连接服务器的命令:sftp:/xxxx@x.x.x.x/xxx/,以特定用户名登录服务器

如何改变PATH
a.直接修改$PATH值:
echo $PATH /查看当前PATH的配置路径
export PATH=$PATH:/xxx/xxx /将需配置路径加入$PATH 等号两边一定不能有空格
生效方法:立即生效
有效期限:临时改变,只能在当前的终端窗口中有效,当前窗口关闭后就会恢复原有的path配置
用户局限:仅对当前用户
b.通过修改.bashrc文件:(.bashrc文件在根目录下)
vi .bashrc /编辑.bashrc文件/在最后一行添上:
export PATH=$PATH:/xxx/xxx //xxx/xxx位需要加入的环境变量地址 等号两边没空格
生效方法:(有以下两种)
..关闭当前终端窗口,重新打开一个新终端窗口就能生效
..输入“source .bashrc”命令,立即生效
有效期限:永久有效
用户局限:仅对当前用户

首次安装DELL 服务器,需要配置好RAID阵列,用U盘安装,CCPROXY联网更新,之后BIOS设置启动SATA AHCI项目,并设置该硬盘为boot device,然后F11选择启动device,从相应硬盘启动
ubuntu自动加载其他硬盘,/ggicci.blog.163.com/blog/static/21036409620120309913116/

Windows远程桌面连接Ubuntu 14.04 出现问题时要考虑桌面环境导致的原因,首先安装xfce:(卸载用purge)
sudo apt-get install xrdp
sudo apt-get install vnc4server tightvncserver
sudo apt-get install xfce4
sudo gedit /etc/xrdp/startwm.sh
在. /etc/X11/Xsession前一行插入 xfce4-session
重启 xrdp /blog.csdn.net/zhutiehan/article/details/28378783
sudo service xrdp restart
安装好后要自行新建配置文件,使得在远程登录时默认使用xfce作为界面登录,然后重启xrdp服务:
echo “xfce4-session” >~/.xsession
sudo service xrdp restart 查看桌面环境用echo $DESKTOP_SESSION ubuntu连win:apt-get install rdesktop; redesktop -f IP (全屏),CTRL+ALT=ENTER退出全屏
IP段如果不同,需要服务器联网后才能登录到服务器,sensors管理机器状况如温度风扇,
出现问题:X Server — no display in range is available. xrdp_mm_process_login_response: login failed;修改/etc/xrdp/sesmain.ini – MaxSessions from 10 to 100

/www.cnblogs.com/tutuye/p/3746289.html

错误:Can’t locate Debian/AdduserCommon.pm 或者xrdp出现问题,可能是perl安装出现问题,可apt-get install perl来解决
或更新系统来完成sudo apt-get update;sudo apt-get dist-upgrade;其他疑难问题可通过卸载-重启-重装方式解决

Win远程服务端连接不上可能是win版本原因,可升级即可
添加用户sudo adduser -m xxx;sudo usermod -a -G adm xxx; sudo usermod -a -G sudo xxx
取消termial apt代理,修改/etc/apt/apt.conf文件
sudo不用频繁输入密码visudo 或者 vi /etc/sudoers, 移动光标,到一行root ALL=(ALL) ALL的下一行,按a,进入append模式,输入
your_user_name ALL=username:ALL
注意:wq!才能保存退出 sudo出问题用这个命令pkexec visudo
gksudo gedit xxx超级用户编辑文本
对于winserver提示由于加密,不能远程访问,关闭防火墙即可
adduser wangshaobo sudo;或者admin加入组

出现ls invalid option –e错误时,尝试使用ls — xxx

/dev下查看硬件设备,sd开头的为硬盘,包括未格式化的硬盘;系统在sdb1,从c到f为disk1-4,sda为disk5,sdg3为外界硬盘18T,常用硬盘命令
sudo fdisk -l#查看硬盘信息;fdisk /dev/sdg3#分区命令;partprobe#不重启更新分区表/www.linuxidc.com/Linux/2012-07/65294.htm

Tab按键无效,是因为被占用了,打开菜单->设置->窗口管理器,或者在终端中输入xfwm4-settings打开,一列有“切换同一应用程序的窗口”选项,将该选项的快捷键清除后关闭窗口即可

右键Open Terminal Here无效时,需要禁用nautilus,Nemo替代之:
首先,安装需要的程序,dconf 是一个编辑系统配置(主要是桌面环境)的程序。sudo apt-get install dconf-tools nemo
然后禁用 Nautilus 绘制桌面图标:gsettings set org.gnome.desktop.background show-desktop-icons false
把 Nemo 设置成默认的文件管理器。xdg-mime default nemo.desktop inode/directory application/x-gnome-saved-search

/www.sinosky.org/set-nemo-as-the-default-file-manager-on-ubuntu.html

终止进程相关命令,在ubuntu中,终止一个进程或终止一个正在运行的程序,一般是通过 kill 、killall、pkill、xkill 等进行,killall -u bioinfo删除用户的所有进程。
pkill firefox;ps aux | grep firefox;等于pgrep;xkill在图形界面中点杀进程;killall <进程名> 批量终止
读取文件夹下所有文件的命令:dir * >files.txt
定时关机 sudo shutdown -h 8:00,-r为重启参数

重装Ubuntu时如何保留/home分区中的数据:只要在安装系统时分出一个/home分区。你可以把Ubuntu的“/”分区看为Windows的C盘,重装Ubuntu时只格式化“/”分区,不格式化“/home”,这样就可以保留“/home”中的数据了。
重装注意:universal USB用iso文件做启动盘,会提示没找到image,不管 输入help后回车,再回车,联网时网卡别选错,在选择软件包时要小心,选上可视化界面。安装分区可选择manual定义分区类别和大小,或者reuse原来分区这样就不会删除数据,根目录最少10G大小,swap设置2倍内存。只清除/下数据开机时按shift可以进入安全模式,进入root shell,忘记密码可重设,passwd “username”, cat /etc/shadow可看用户名;bash no directory是由于可执行文件是在32位系统编译,需重新编译或者安装相关库gcc链接库。

/www.2cto.com/os/201308/238302.html

squid安装及配置,用于网络分享,或者类似win下ccproxy,VM远程登录需要网卡改为桥接,代理可用IE自主机
sudo aptitude install squid
sudo chmod 777 /etc/squid3/squid.conf
sudo vim /etc/squid3或squid/squid.conf
加入h
http_port 3128
http_access allow all 两行即可
vim删除行:wq状态下输入:10,d表示保留最前面十行;卸载后重装squid即可
wget使用代理 :wget /www.baidu.com/ -e use_proxy=yes -e http_proxy=yourproxy.com:port

ubuntu安装rpm:Install alien (and deps), its available in Debian, Ubuntu repository:
sudo apt-get install alien dpkg-dev debhelper build-essential
Convert rpm package using command
sudo alien -k –scripts some-rpm-package.rpm
Install it using this command
sudo dpkg -i some-rpm-package.deb

error 1325 documents is not a valid short file name;因为系统的我的文档没有存在,My Documents文件夹
VM虚拟机打不开,Inaccessable,把.prev的内容拷贝到.vbox中即可
iscsi网络硬盘:先用win系统及管理端口配置数据端口IP。客户端装open-iscsi,
iscsiadm -m discovery –type sendtargets –portal 59.79.248.76#发现设备
sudo iscsiadm -m node -T iqn.1984-05.com.dell:powervault.6001c23000d1a07a0000000047cd2fe2 -p 59.79.248.68:3260 -u#链接设备

/www.cnblogs.com/baoyiluo/p/3314437.html

/czmmiao.iteye.com/blog/2055805

/wenku.baidu.com/link?url=LDIoAcrU1Vl-kM_T60_QFvWQEnCzlyup3CI2mMz-bEwX9PS-ve2Yn2pDIy6IUtAxFHRiat16G60gOTtSqMk4MPBysInX1_HRXYQ9BTkkUba 百度文库第二章MD3000i 配置指南

dell安装RAID阵列磁盘
关机、重启、按CTRL+R 进入服务器RAID管理;(开机自检一般会有各个部分设置的提示和按键)
(1)ctr+p看看是否识别到硬盘,正常应该看到4块硬盘,前3块有dg显示online的,是原来的硬盘,新盘如果没有数据应该显示为foreign;
(2)crt+n返回controller,光标移到controller 0上按f2—》foreign—》foreing config—-》clear确认;
(3)ctr+p看看新加的硬盘是否由foreign显示为Ready,如果是就正常,crt+n返回controller;
(4)光标移到VD界面第一行Adapter上按f2 —》Create new vd;
(5)raid level选RAID-0,把新要加入raid-0的硬盘用空格选上,然后按tab到ok确认即可;
(6)选中vd,进行初始化,Fast Init.
(7)esc退出,会提示你按ctl+alt+delete重启。
查看硬盘lsscsi,lspci看网卡;udo apt-get install gnome-disk-utility磁盘管理器

/www.cnblogs.com/hnrainll/archive/2012/02/27/2369331.html新盘分区,格式化,挂载

外置存储MD3—系列硬盘要通过数据管理链接,进入系统进行配置,MD3200,SAS IN 0接HBA卡
MD3000i管理端口及配置/wenku.baidu.com/link?url=22I7gCuP_G7SpLSg38KHcVvmDlZzk6BNtW9LNChUsE9z7AutimCc-09rdOiohTXVRkrKOnMY9R79OmtQtUqYl8FAtR8p-L4pe0kpEcpgAV7
打不开网页ipconfig /flushdns重建DNS列表
查看文件夹文件大小du -h –max-depth=1
mysql会占很大空间,要删除日志

关机/断网后不能重新识别网卡,自动获取IP(可换网口试试)
sudo -i
vi /etc/default/avahi-daemon #AVAHI_DAEMON_DETECT_LOCAL=0
灰色Network manager,或者不能编辑网络连接network connections原因是没权限,利用命令行打开它
One quick work-around is to invoke the connection editor manually from the command line:sudo nm-connection-editor

ubuntu dhcp不能自动获取ip
$ sudo dhclient -r /release ip 释放IP
$ sudo dhclient /获取IP
$ sudo dhclient
# ifdown eth0
# ifup eth0
# service networking restart

Gedit汉字有乱码解决》命令方式gsettings set org.gnome.gedit.preferences.encodings auto-detected “[‘GB18030′, ‘UTF-8′, ‘CURRENT’, ‘ISO-8859-15′, ‘UTF-16′]”
图形方式 运行dconf-editor 展开/org/gnome/gedit/preferences/encodings auto-detected的Value中加入 ‘GB18030′ ,加在UTF-8前面;

kylin删除客人会话,在终端里进入/usr/share/lightdm/lightdm.conf.d/目录 sudo vim 50-guest-wrapper.conf  然后在文件里输入:
[SeatDefaults]
allow-guest=false
网卡没有显示或者没有信号是因为被列入黑名单,不在启动模块里/etc/modprobe.d/blacklist-mt7601u.conf将其注释掉,移出黑名单
java出问题,找不到类,是因为没有修改环境变量。可以直接用java的绝对路径进行运行…/java -jar xxx.jar
ubuntu批量处理文件夹下文件的命令for subdir in *; do mv $subdir/file.txt $subdir.txt; done;
文本的批量操作/bconnelly.net/working-with-csvs-on-the-command-line/
批量提取某列awk ‘FNR==1{f++}{a[f,FNR]=$2}END{for(x=1;x<=FNR;x++){for(y=1;y Perl提示模块@NIC没定位到Can’t locate Math/CDF.pm in @INC,perl -MCPAN -e ‘install Math::CDF’安装

Ubuntu中R的安装

首先在win系统中安装Ubuntu,先在系统中预留空间50+12+11G,UniversalUSB将ubuntu.iso刻录到U盘或硬盘,设置uefi启动方式或者默认方式,进行系统安装,安装完成后会自动出现grub菜单。
用ubuntu9.10的livecd启动后,打开终端,假如你的ubuntu的 / 分区是sda7,又假如 /boot分区是 sda6,用livecd启动,在终端下输入
sudo -i
mount /dev/sda7 /mnt
grub-install –root-directory=/mnt /dev/sda和前面一样,要装入第二硬盘的把sda改为sdb。如果grub.cfg己丢失,或grub.cfg出现错误,需要重建的继续执行下面操作:
mount –bind /proc /mnt/proc
mount –bind /dev /mnt/dev
mount –bind /sys /mnt/sys
chroot /mnt update-grub
umount /mnt/sys
umount /mnt/dev
umount /mnt/proc
exit
进入Ubuntu后sudo update-grub2,出现2个引导菜单
R的安装,可下载tar.gz后解压安装:./configure;make;make install;library可以从旧版本R拷贝进去到library文件夹,然后update.packages()更新安装包s
安装或卸载R 先source(“/bioconductor.org/biocLite.R”);biocLite(“WGCNA”)安装它;biocLite()自动更新

/blog.fens.me/r-install-ubuntu/

Ubuntu下一般和R版本没关系,如出现安装问题,类似
nstallation of package ‘/home/bioinfo/preprocessCore_1.32.0.tar.gz’ had non-zero exit status
Warning message:
package ‘Hmisc’ is not available (for R version 3.2.2)
注意:有的包发送permission denied错误,需要sudo chmod -R 777 文件夹即可解决

需要进行离线安装,下载tar.gz包,用install.packages(“/home/bioinfo/fastcluster_1.1.20.tar.gz”,repos=NULL)这种格式依次安装需要安装的包和依赖包,再装需要的包/
R3.2.5需要安装这些包”matrixStats”, “Hmisc”, “foreach”, “doParallel”, “fastcluster”, “dynamicTreeCut”, “survival”
其他包出现安装问题也是类似,source(‘/www.bioconductor.org/biocLite.R’)
> biocLite(‘cummeRbund’)
手动安装依赖包,最后再安装包
在线安装不成就离线安装,直到所有依赖包完整安装!
查看包版本packagesVersion()

NCBI可视化本地化,sequenceserver
安装blast:tar -zxvf ncbi-blast-2.2.30+-x64-linux.tar.gz;vim ~/.bashrc;加入export PATH=/db/home/shenwei/local/app/blast/bin:$PATH
安装Ruby,Ruby-dev,RubyGems
安装sequenceserver:sudo gem install sequenceserver
配置sequenceserver:加入blast路径echo “export PATH=/db/home/blast/bin:\$PATH” >> ~/.bashrc;database: /Users/me/blast_databases/
sequenceserver -m安装数据库,数据库从ensemblPlants下载到Download文件夹

/www.chenlianfu.com/

Sleuth 包的安装/scilifelab.github.io/courses/rnaseq/labs/kallisto;kallisto needs do bootstrap for sleuth analysi
>source(“/bioconductor.org/biocLite.R”)
>biocLite(“rhdf5″)
>install.packages(“devtools”)
>devtools::install_github(“pachterlab/sleuth”)#若出现问题,离线安装
>library(“sleuth”)
>base_dir <- "~/sample/kallisto/test/"
>sample_id <- dir(file.path(base_dir,"results"))
>kal_dirs <- sapply(sample_id, function(id) file.path(base_dir, "results", id, "kallisto"))
>s2c <- read.table(file.path(base_dir, "hiseq_info.txt"), header = TRUE, stringsAsFactors=FALSE)
>s2c <- dplyr::select(s2c, sample = run_accession, condition)
>s2c <- dplyr::mutate(s2c, path = kal_dirs)
>so <- sleuth_prep(s2c, ~ condition)
it works:s2c <- read.table(file.path(getwd(), “hiseq_info.txt”), header = TRUE, stringsAsFactors=FALSE)
s2c <- dplyr::mutate(s2c, path = ‘/disk5/kallisto’)
so <- sleuth_prep(s2c, ~ condition) # or direct s2c with three columns sample,condition,path,more than two samples
差异分析的话t2g表可以自行制作

biomaRt USING:/wangyufeng222.blog.163.com/blog/static/1282220702010115332177/;listDatasets(plant)

excel删除重复行:/www.wordlm.com/Excel/2003/2288.html
R矩阵小数点位数:data=read(‘xxx.csv’), datSummary=data[,1:1],data2=round(matrix,2),out=data.frame(data2,row.names=FALSE),write.csv(out,’out.csv’)
sep=’\t’,表示告诉R这个表格是以Tab键作为列分割的
删除矩阵中重复列data[, !duplicated(t(data))];重复行data[!duplicated((data)),]
csv中追加数据用write.table(xx,”xx.csv”,append=TRUE)
运行脚本:source(“chisq2.R”);提示REAL() can only applied to ….是数据矩阵出问题,比如excel包含非字符列,或者每列元素数不一致等导致
矩阵或向量间的相关性计算cor(x,y,use=”pairwise.complete.obs”);查看R对象属性class(),typeof();转换as.numeric(),as.matrix(),as.vector();定义matrix(,nrow=n),vector()
矩阵指数或对数转换:dat=read.csv(‘.csv’),dat2=2^(dat[,-1]),write.csv(round(dat2,2),’out.csv’)
批量从多个csv提取特定1列并合并后重命名列头为文件名
files <- list.files(pattern = “*.tsv”)
res1 <- do.call(cbind, lapply(files,function(fn) read.csv(fn, header = T,sep=”\t”)[,5]))
colnames(res1)=files
write.csv(res1,”test.csv”)

為什麼我起床後足跟會痛?足跟疼痛症候群

相信很多人都有過足跟疼痛的經驗。在門診常常遇到這一類病人,主訴足跟疼痛,尤其是在早晨起床剛下床,腳一接觸到地面時疼痛更是明顯。但在走幾步路以後,足底疼痛反而慢慢減輕。同樣的情形也可見於久坐之後,我們把這叫做「足跟疼痛症候群」。
到底是什麼原因導致「足跟疼痛症候群」呢?簡單的說就是「過度使用」使得足底肌腱產生發炎現象,通常這種情形亦跟足底襯墊組織退化有關。凡是跑步跑太多、站太久、爬山等等使足跟負荷過量,都有可能造成足跟疼痛症候群。所以治療的原則即是休息,此外在鞋子的選擇方面,也要選用軟底且足墊合腳的鞋子,如此減低足部的負擔之後,足跟疼痛才會獲得改善。當然也有些病人患有慢性足跟疼痛症候群,需要局部注射或震波治療才能達到療效在門診遇到這一類病人,除了開立抗發炎的藥物之外,亦會教導病人做足筋的伸展運動,一般效果都不錯。在此將這運動介紹於後。
面對牆壁,一腳在前,一腳在後(有症狀的腳),然後身體往前傾,保持足跟接觸地面,這時你會感覺足筋漸漸繃緊,然後維持繃緊的感覺十秒鐘,之後放鬆,身體推離牆壁。重覆這個動作二十次。如果你雙腳皆有足跟疼痛的症狀,則做完之後,雙腳前後位置互換,做另一腳的足筋伸展運動。
一般病人持續做這個運動後,再配合醫師開立的口服藥物,大部分會在一個星期之內得到症狀的改善,有此症狀的病友趕快試試看!。

(859) 234-7381

我们很容易犯以下错误,如果:
0. 缺乏数据(Lack Data)
1. 太关注训练(Focus on Training)
2. 只依赖一项技术(Rely on One Technique)
3. 提错了问题(Ask the Wrong Question)
4. 只靠数据来说话(Listen (only) to the Data)
5. 使用了未来的信息(Accept Leaks from the Future)
6. 抛弃了不该忽略的案例(Discount Pesky Cases)
7. 轻信预测(Extrapolate)
8. 试图回答所有问题(Answer Every Inquiry)
9. 随便地进行抽样(Sample Casually)
10. 太相信最佳模型(Believe the Best Model)

0. 缺乏数据(Lack Data)

对于分类或预估问题来说,常常由于缺少准确标注的案例而不能获得最佳收益,对于聚类更是如此。 有趣的标注可能非常稀少,因此,在收集到足够多的关键数据之前一些项目不能开局。

例如:欺诈侦测,在上百万的交易中,可能只有屈指可数的欺诈交易,还有很多的欺诈交易没有被正确标注出来,这就需要在建模前花费大量人力来修正。

1. 太关注训练(Focus on Training)

只有样本外数据上的模型评分结果才真正有用!

例如:机器学习或计算机科学研究者常常试图让模型在已知数据上表现最优,这样做的结果通常会导致过度拟合(overfit)。

解决方法:进行重抽样(Re-Sampling)。重抽样技术包括:bootstrap、cross-validation、jackknife、leave-one-out…等等。

2. 只依赖一项技术(Rely on One Technique)

不要简单地信赖你用单个方法分析的结果,至少要和传统方法(比如线性回归或线性判别分析)做个比较。

解决方法:使用一系列好的工具和方法。(每种工具或方法可能最多带来5%~10%的改进)。

3. 提错了问题(Ask the Wrong Question)

a)项目的目标:一定要锁定正确的目标

例如:欺诈侦测,不要试图在一般的通话中把欺诈和非欺诈行为分类出来,重点应放在如何描述正常通话的特征,然后据此发现异常通话行为。

b)模型的目标:让计算机去做你希望它做的事

大多数研究人员会沉迷于模型的收敛性来尽量降低误差,这样让他们可以获得数学上的美感。但更应该让计算机做的事情应该是如何改善业务,而不是仅仅侧重模型计算上的精度。

4. 只靠数据来说话(Listen (only) to the Data)

a)投机取巧的数据:数据本身只能帮助分析人员找到什么是显著的结果,但它并不能告诉你结果是对还是错。
b)经过设计的实验:某些实验设计中掺杂了人为的成分,这样的实验结果也常常不可信。

5. 使用了未来的信息(Accept Leaks from the Future)

例子:预测芝加哥银行在某天的利率,使用神经网络建模,模型的准确率达到95%。但在模型中却使用了该天的利率作为输入变量。

解决方法:
a)要仔细查看那些让结果表现得异常好的变量,这些变量有可能是不应该使用,或者不应该直接使用的。
b)给数据打上时间戳,避免被误用。

6. 抛弃了不该忽略的案例(Discount Pesky Cases)

异常值可能会导致错误的结果,但也可能是问题的答案,数据中的不一致性有可能会是解决问题的线索,深挖下去也许可以解决一个大的业务问题。

例如:在直邮营销中,在对家庭地址的合并和清洗过程中发现的数据不一致,反而可能是新的营销机会。

解决方法:可视化可以帮助你分析大量的假设是否成立。

7. 轻信预测(Extrapolate)

人们常常在经验不多的时候轻易得出一些结论,即便发现了一些反例,人们也不太愿意放弃原先的想法。

解决方法:没有正确的结论,只有越来越准确的结论。

8. 试图回答所有问题(Answer Every Inquiry)

“不知道”是一种有意义的模型结果,模型也许无法100%准确回答问题,但至少可以帮我们估计出现某种结果的可能性。

9. 随便地进行抽样(Sample Casually)

a)降低抽样水平。

解决方法:“喝前摇一摇!”先打乱原始数据集中的顺序,从而保证抽样的随机性。

b) 提高抽样水平。

解决方法:先进行数据集划分,然后再提高训练集中违约客户的权重。

10. 太相信最佳模型(Believe the Best Model)

可解释性并不一定总是必要的,看起来并不完全正确或者可以解释的模型,有时也会有用;“最佳”模型中使用的一些变量,会分散人们太多的注意力。

解决方法:把多个模型集装起来可能会带来更好更稳定的结果。

原文:/www.salford-systems.com/doc/elder.pdf