" />
GPAT生物序列模式搜索程序是時(shí)下互聯(lián)網(wǎng)常用的教育教學(xué)軟件之一,該軟件綠色、安全、無毒,讓你可以放心使用。
GPAT生物序列模式搜索程序,開發(fā)的基于IBM Splash算法的生物序列模式搜索程序。運(yùn)行環(huán)境為L(zhǎng)INUX,多線程運(yùn)行,使用多CPU,運(yùn)行速度快,特別適合序列中重復(fù)模式的定位。
目的獲取IBMSPLASH算法核心代碼,為進(jìn)一步開展生物序列模式識(shí)別研究提供一個(gè)高效算法引擎。方法基于SPLASH算法開發(fā)核心代碼,運(yùn)用開源軟件工具,開發(fā)、調(diào)試和優(yōu)化程序。結(jié)果開發(fā)出GNUPattern(Gpat)程序,高效實(shí)現(xiàn)了SPLASH算法的核心部分,并提供全部源碼,其他研究人員可以在GNU許可協(xié)議下修改該程序。結(jié)論Gpat成功地實(shí)現(xiàn)了SPLASH算法,并為下游生物序列模式識(shí)別研究提供鋪墊。
生物序列數(shù)據(jù)挖掘的主要目的是識(shí)別序列中的功能元素、研究序列間的相互關(guān)系等等。生物序列模式挖掘和生物序列聚類是生物序列數(shù)據(jù)挖掘中重要的兩個(gè)研究?jī)?nèi)容。生物序列模式挖掘是識(shí)別功能元素進(jìn)而了解序列功能等的關(guān)鍵技術(shù), 序列模式還能夠描述序列特征,作為生物序列聚類相似性度量設(shè)計(jì)的依據(jù);生物序列模式挖掘也是生物序列關(guān)聯(lián)分析的基礎(chǔ)。生物序列聚類是研究序列間相互關(guān)系進(jìn)而解釋進(jìn)化關(guān)系等的主要手段,其結(jié)果是具有共同特征的序列簇;另外在這樣的簇中挖掘序列模式能進(jìn)一步提高序列模式挖掘結(jié)果的準(zhǔn)確率,從而更好的指導(dǎo)功能元素的識(shí)別;生物序列聚類也可作為分類、異常挖掘等的預(yù)處理步驟。