Vocabulary – Algoritmit, ohjelmat ja tietokannat

Bioinformatiikan sanasto

Algoritmit, ohjelmat ja tietokannat

Kaikki | Nukleotidit ja nukleiinihapot | Proteiinit ja aminohapot | Algoritmit, ohjelmat ja tietokannat

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | Å

A

AMBER
Biologisille makromolekyyleille kehitetty mallitusohjelmisto ja voimakenttä. http://www.amber.ucsf.edu/amber/amber.html

B

BLAST
(Basic Local Alignment Search Tool)
Ohjelma/algoritmi joka etsii hakusekvenssin kanssa samankaltaista sekvenssiä ja rinnastaa sekvenssit paikallisesti. Hakusekvenssi
ja -tietokanta voivat olla nukleotidi- ja proteiinisekvenssien mikä tahansa yhdistelmä eli DNA-sekvenssillä voi hakea myös
aminohapposekvenssitietokannasta ja päin vastoin.
http://www.ncbi.nlm.nih.gov/BLAST/
BLITZ
Rinnakkaislaskentaa hyödyntävä Smithin ja Watermanin algoritmiin pohjautuva sekvenssihakuohjelma.
BLOCKS
Tietokanta ja analyysipalvelin hyvin samankaltaisten proteiinisekvenssialueiden etsintään ja vertailuun. http://www.blocks.fhcrc.org/
BLOSUM
(Blocks Substitution Matrix)
Pisteytysmatriisisarja, jota käytetään sekvenssianalyyseissä. Perustuu BLOCKS-tietokannan kaukaista sukua olevien sekvenssien
paikallisiin rinnastuksiin.
bootstrap
itselataava
Menetelmä, jossa algoritmin antamaa tulosta testataan toistamalla algoritmia sekoitetuilla aloitusarvoilla tai syöttötiedoilla.
Sekoitus tehdään satunnaisesti, mutta kuitenkin tavalla, jonka ei pitäisi vaikuttaa käytetyn menetelmän antamaan tulokseen.
byte
(MB)
tavu
Määrämittainen, yleensä kahdeksan bitin muodostama
kokonaisuus. Esimerkiksi yhden kirjainmerkin esittämiseen tarvitaan
yleensä yksi tavu.

C

CHARMM
Biologisille makromolekyyleille kehitetty
mallitusohjelmisto ja voimakenttä. http://yuri.harvard.edu/
Chou-Fasman analysis
Choun ja Fasmanin analyysi
Yksi proteiinien sekundäärirakenteen ennustusmenetelmistä.
Clustal (ClustaW, ClustalX)
Monen sekvenssin (DNA- tai aminohappo-) rinnastusohjelma. http://www.infobiogen.fr/docs/ClustalW/clustalw_help.html
consensus sequence
konsensussekvenssi
DNA-, RNA- tai aminohapposekvenssiryhmän perusteella matemaattisin menetelmin tehty sekvenssi, joka kuvastaa nukleotidien
tai aminohappojen yleisintä muotoa kussakin sekvenssin kohdassa. Alueet, joilla vastaavuus on suuri, heijastavat yleensä yhteistä
toiminnallista historiaa.
covariance
kovarianssi
Kahden muuttujan yhteistä vaihtelua kuvaava tunnusluku.

D

Dali
Menetelmä ja WWW-palvelin, jolla voi verrata proteiinin 3D-rakennetta PDB-tietokannassa oleviin rakenteisiin. Katso myös
FSSP.
http://www.ebi.ac.uk/dali/

DDBJ
(DNA DataBank of Japan)
Japanilainen nukleotidisekvenssitietokanta, jota ristiinpäivitetään EMBL:n ja GenBankin kanssa. http://www.ddbj.nig.ac.jp/Welcome.html
Discover
Kaupallinen, MSI:n tuottama molekyylisimulaatio-ohjelmisto, joka soveltuu myös biologisten makromolekyylien simuloimiseen.
distance geometry
etäisyysgeometria
Molekyylien rakennemäärittelyssä käytettävä laskennallinen menetelmä. Menetelmässä määritetään joukko atomien välisten etäisyyksien
välisiä raja-arvoja, joiden perusteella luodaan molekyylin rakennemalleja. Käytetään etenkin NMR-spektroskopian yhteydessä.
distance matrix
etäisyysmatriisi
Taulukko, joka kuvaa taksonien parittaisia eroja.
docking
telakointi
Molekyylien sovittaminen toisiinsa esimerkiksi ligandien sitoutumista tutkittaessa.

E

EM algorithm
(expectation maximisation algorithm)
odotuksen maksimointialgoritmi
Yleinen menetelmä maksimaalisen samankaltaisuuden laskemiseen.
EMBOSS
(The European Molecular Biology Open Software Suite)
Sekvenssianalytiikan ohjelmistopaketti. Eurooppalaisten bio-ohjelmistokehittäjien yhteistyöhanke, jossa yhdistetään jo olemassa
olevia ja kehitettäviä ohjelmia ja työkaluja julkisesti saatavaksi ohjelma- ja kirjastokokonaisuudeksi. http://www.uk.embnet.org/Software/EMBOSS
Ensembl
EBI:n ja Sanger Centerin ylläpitämä genomidataan keskittynyt WWW-palvelin. http://www.ensembl.org/
evolutionary distance
evoluutioetäisyys
Taksonien väliset erot esim. molekyyleissä ovat tarkasteltavissa stokastisin menetelmin, joiden avulla kullekin taksoniparille
saadaan evolutiivista etäisyyttä kuvaava tunnusluku.
ExPASy
(Expert Protein Analysis System)
Proteomiikkapalvelin, jota ylläpitää Swiss Institute of Bioinformatics (SIB). http://www.expasy.ch/

F

FastA
Sekvenssihakuohjelma, joka perustuu Pearsonin ja Lipmanin algoritmiin. http://fasta.bioch.virginia.edu/
Fitch-Margoliash method
Fitch-Margoliash -menetelmä
Evolutiikassa: puukaavioiden luomisessa käytettävä heuristinen menetelmä.
FSSP
(Fold classification based on Structure-Structure alignment of Proteins)
Tietokanta, jossa PDB-rakenteet on luokiteltu 3D-rakenteidensa perusteella
Dali-menetelmällä. http://www.ebi.ac.uk/dali/fssp/fssp.html
FTP
(File Transport Protocol)
Yleinen tiedostojen siirtokäytäntö tietokoneiden välillä.

G

gap
aukko
Aukko sekvenssirinnastuksessa.
GAP
Ohjelma sekvenssien parittaiseen vertailuun.
GCG
(The Wisconsin Package of the Genetics Computer Group, Inc. )
Sekvenssianalytiikkaohjelmisto, joka sisältää ohjelmia DNA-, RNA- ja proteiinisekvenssien karakterisointiin, hakuun ja vertailuun. http://www.accelrys.com/products/gcg_wisconsin_package/index.html
GenBank
Yhdysvaltalainen NCBI:n ylläpitämä DNA-sekvenssitietokanta, jota ristiinpäivitetään EMBL:n ja DDBJ:n kanssa. http://www.ncbi.nlm.nih.gov/Genbank/index.html
Genehunter
Kytkentäanalyysiohjelma, jota voi käyttää sekä parametriseen että ei-parametriseen kytkentäanalyysiin. Ohjelmalla voi analysoida
vain pieniä sukupuita, mutta useita geenimerkkejä voidaan käyttää samanaikaisesti. http://linkage.rockefeller.edu/soft/gh/
genetic algorithm
geneettinen algoritmi
Evoluutiomekanismeja matkiva optimointimenetelmä. Algoritmi perustuu ongelman kuvaamiseen ratkaisujoukkona, johon kohdistetaan
valintaa, tekijäinvaihduntaa ja mutaatioita.
GeneWise
Algoritmi/ohjelma, jota käytetään genomisten
DNA-sekvenssien etsinnässä ja analyyseissä. Perustuu kätkettyihin Markovin malleihin. http://www.sanger.ac.uk/Software/Wise2
global alignment
kokonaisrinnastus
Sekvenssien rinnastaminen niin, että sekvenssien samankaltaisuuksia pyritään löytämään koko pituudelta. Katso local alignment.
GROMACS
Biologisille makromolekyyleille kehitetty mallitusohjelmisto ja voimakenttä. http://rugmd4.chem.rug.nl/~gmx/

H

HCA
(hydrophobic cluster analysis)
katso hydrophobic cluster analysis.
helical wheel
kierrekaavio
Peptidisekvenssin esitystapa, jossa kuvataan sivuketjujen sijoittuminen alfa-kierteen eri puolille. Käytetään amfipaattisten
kierteiden etsimisessä.
heuristic
heuristinen, kokemusperäinen
Algoritmien yhteydessä heuristisella menetelmällä tarkoitetaan kokemusperäistä ja/tai oletuksiin perustuvaa menetelmää.
HMM
(Hidden Markov Model)
kätketty Markovin malli
Malli, jossa havaintoja mallitetaan piilevällä kerroksella, jolle on määritelty Markov-ominaisuus (mallin seuraava tila riippuu
vain edellisestä tilasta).
HMMer
Ohjelmapaketti, joka käyttää HMM-menetelmää sekvenssianalytiikassa. http://hmmer.wustl.edu/
Hopp-Woods
Yksi proteiinien hydropaattisuuden ennustusmenetelmistä.
HTML
(HyperText Markup Language.)
WWW-sivujen kuvauskieli.
HTTP
(HyperText Transfer Protocol.)
WWW-palvelimien käyttämä yhteydenpitomenetelmä.
hydropathy plot
proteiinin hydropaattisuuden ennuste
Kuvaaja, jossa on esitetty proteiinisekvenssin vesipakoisuus tai vesihakuisuus sekvenssin funktiona. Yleensä arvo lasketaan
käyttämällä tietyn mittaista tarkastelualuetta ja (painotettua) keskiarvoa, jolloin myös sekvenssissä tutkittavan aminohapon
ympärillä olevat kohdat tulevat huomioiduiksi.
hydrophobic cluster analysis
(HCA)
hydrofobinen klusterianalyysi
Ennustaa hydropaattisuutta ja sekundäärirakenteita.

I

InsightII
Kaupallinen molekyylimallitusohjelma, joka sisältää useita biologisten makromolekyylien mallitukseen soveltuvia ominaisuuksia.
http://www.accelrys.com/insight/index.html
in silico
tietokoneessa
Toimenpide joka tehdään laskennallisesti. Esim. erilaiset simulaatiot.

J

Jukes-Cantor model
Jukesin ja Cantorin malli
DNA:n emäskorvautumismalli, jossa kaikki korvautumismahdollisuudet ovat yhtä todennäköisiä.

K

KEGG
Kyoto Encyclopedia of Genes and Genomes
Palvelu johon on koottu tietoa molekyylibiologisista reaktio- ja signaalireiteistä
sekä molekyylien ja geenien välisistä vuorovaikutuksista. http://www.genome.ad.jp/kegg/
Kimura model
Kimuran malli
2-parametrinen ja 3-parametrinen Kimuran malli ovat yleisesti käytettyjä DNA:n
emäskorvautumismalleja. 2-parametrisessa mallissa transitioiden todennäköisyys on eri kuin
transversioiden todennäköisyys. 3-parametrisessa mallissa mallia on kehitetty siten, että eri
transversioille käytetään kahta eri parametria.
ktup
Monien hakualgoritmien (mm. FastA) parametri, joka määrittelee, kuinka pitkiä
sekvenssialueita haun ensimmäisessä vaiheessa tarkastellaan. Parametri vaikuttaa sekvenssihaun
herkkyyteen ja nopeuteen ( arvo on tyypillisesti 1 tai 2 proteiineille, 3-6 nukleiinihapoille;
mitä pienempi, sitä herkempi, mutta hitaampi).
Kyte-Doolittle
Algoritmi aminohapposekvenssin hydropaattisuuden laskemiseen.

L

Linkage
ohjelma kytkentäanalyysiin. Ohjelma on käyttökelpoinen suurille sukupuille, mutta laskenta-algoritmi mahdollistaa vain muutaman
merkkigeenin samanaikaisen käytön. http://linkage.rockefeller.edu/soft/linkage/
local alignment
paikallinen rinnastus
Vertailtavista sekvensseistä etsitään huomattavan
samankaltaisia alueita. Tulos esitetään yleensä taulukkona,
jossa sekvenssien vastinkohdat ovat samassa sarakkeessa. Vert.
kokonaisrinnastus, global alignment.

Logo
Usean sekvenssin rinnastusohjelma.

M

MACAW
Ohjelma, jolla voi paikallisesti rinnastaa sekvenssejä.
masking
peittäminen, suodatus.
poistaa yksinkertaiset toistot ja homopolymeeriset jaksot sekvenssistä ennen
tietokantahakua tai linjausta, jotta ne eivät antaisi vääriä positiivisia tuloksia ja häiritsisi
hakua. Suodatusohjelmien (esim. SEG proteiineille ja DUST nukleiinihapoille) peittämät aminohapot
esitetään usein rinnastuksissa X-kirjaimina ja emäkset N-kirjaimina
maximum likelihood
suurimman uskottavuuden menetelmä
Menetelmää käytetään mm. evolutiikassa etsittäessä fylogeneettistä puuta, joka parhaiten toteuttaa asetetun evoluutiomallin.
maximum parsimony
parsimoniamenetelmä, niukkuusmenetelmä
Sukulaissuhteiden selvitysmenetelmä, jonka tulostama fylogeneettinen puu vähimmin mahdollisin muutoksin selittää aineiston.

Megabyte
(MB)
megatavu
Tiedoston tai tietokonelevyn koon tai kapasiteetin mitta. Yksi
megatavu sisältää 2 potenssiin 20 tavua eli noin miljoona tavua.
Metropolis algorithm
Metropolis-algoritmi
Satunnaisuutta käyttävä optimointitehtävien ratkaisumenetelmä.
midnight zone
pimeä alue
Sekvenssejä vertailtaessa alue, jolla vertailun luotettavuutta ei voida arvioida.
Minimum Evolution
(ME)
minimievoluutio
Menetelmä, joka etsii lyhimmän etäisyysehdot täyttävän puukaavion.
molecular clock
molekyylikello
Hypoteesi, jonka mukaan molekyylien evoluutio on ajan suhteen vakio eli molekyylien eroista voidaan suoraan laskea niiden
erkanemisajankohta.
molecular dynamics
molekyylidynamiikka
Simulointimenetelmä, jossa molekyylien liikettä seurataan ajan funktiona. Yleensä laskennassa käytetään klassisen mekaniikan
liikeyhtälöitä.
molecular mechanics
molekyylimekaniikka
Menetelmä molekyylien rakenteen ja dynamiikan laskemiseen. Yleisnimitys laskennallisille menetelmille, joissa tutkitaan molekyylin
avaruusrakenteen muutoksien vaikutusta potentiaalienergiaan. Yleisimmin käytetty molekyylimekaaninen tehtävä on voimakenttään
perustuva komiulotteisen rakenteen optimointi.
molecular modeling
molekyylimallitus
Molekyylin avaruusrakenteen tutkimus tai ennustus rakennemallien avulla. Tarkoittaa yleensä tietokoneavusteista molekyylien
kolmiulotteisten mallien käsittelyä.
Monte Carlo method
Monte Carlo -menetelmä
Satunnaisuuteen perustuva numeerinen menetelmä.
most parsimonious tree
(MPT)
parsimonisin puu. Fylogeneettinen puu, joka selittää aineiston yksiköiden väliset erot vähimmin mahdollisin muutoksin.
MPT
(most parsimonious tree)
katso most parsimonious tree.
MultAlin
Usean sekvenssin rinnastusmenetelmä. http://www.toulouse.inra.fr/multalin.html
MultiDisp
Usean sekvenssin rinnastuksen visualisointiohjelma. http://protein.uta.fi:8080/cgi-bin/MultiDisp.cgi
multiple sequence alignment
(MSA)
monen sekvenssin rinnastus
Sekvenssiaineiston esittäminen niin, että samankaltaiset kohdat on aseteltu päällekkäin.
multipoint linkage analysis
monipistekytkentäanalyysi
Kytkentäanalyysi, jossa uuden lokuksen sijaintia kytkentäryhmässä (kromosomissa) tutkitaan usean sellaisen lokuksen avulla,
joiden suhteelliset etäisyydet toisiinsa tiedetään.

N

NDB
(Nucleic Acid Database)
Nukleiinihapporakenteita sisältävä tietokanta. http://ndbserver.rutgers.edu/
Needleman-Wunsch algorithm
Needlemanin ja Wunschin algoritmi
Dynaamiseen ohjelmointiin perustuva sekvenssivertailualgoritmi kahden sekvenssin rinnastukseen. Algoritmi etsii kahden sekvenssin
välisen parhaan mahdollisen kokonaisrinnastuksen.
neighbor-joining algorithm
neighbor joining -algoritmi, NJ-algoritmi
Evolutiikassa: puukaavioiden luomisessa käytettävä heuristinen menetelmä.
neural network (artificial neural network)
neuroverkko, hermoverkko
Algoritmi, jonka toiminta jäljittelee tietojenkäsittelyä biologisissa hermoverkoissa. Neuroverkkoalgoritmien tarkka määritelmä
vaihtelee eri yhteyksissä. Yleisiä tunnusmerkkejä ovat mm. 1. Tieto syötetään neuroverkkoon oppimisprosessin avulla, 2. verkko
sisältää useita toisiinsa kytkeytyneitä yksikköjä, joiden välisiin vuorovaikutussuhteisiin tieto varastoituu.
nonparametric analysis
ei-parametrinen analyysi
Tilastotieteessä: ei oleteta mitään aineistoa kuvaavien jakaumien muodosta.
nonsense mutation
DNA:n emäsjärjestyksen muutos, jonka seurauksena proteiinisynteesi pysähtyy. Stop-kodonin tuottava mutaatio.
nonsynonymous substitution
ei-synonyyminen substituutio
Aminohapon korvaus täysin toisentyyppisellä aminohapolla.
NP-hard
(Nondeterministic polynomial complete/hard)
NP-täydellinen tai -vaikea
Laskentaongelman ominaisuus. NP-täydellisille ongelmille tunnetaan vain hyvin hitaita ratkaisualgoritmeja, joiden aikavaatimus
kasvaa eksponentiaalisesti algoritmin syöttötietojen määrän mukana (ns. kombinatorinen räjähdys). Tämän takia NP-täydellisten
ongelmien ratkaisuun käytetään usein (epätarkkoja) heuristisia menetelmiä.

O

OMIM
(Online Mendelian Inheritance in Man)
Geneettisten sairauksien tietokanta.
http://www.ncbi.nlm.nih.gov/Omim/

P

PAM
(Point Accepted Mutation).
Sarja pisteytysmatriiseja, joilla määritetään aminohappoja vertailtaessa, miten aminohapot vastaavat toisiaan eli mikä on
niiden samankaltaisuuden aste.
parametric analysis
parametrinen analyysi
Tilastollinen menetelmä, joka tekee oletuksia populaation jakaumasta tarkastellun ominaisuuden suhteen.
parsimony
katso maximum parsimony.
PAUP
(Phylogenetic Analysis Using Parsimony)
Fylogenetiikkaohjelmisto, jonka avulla voidaan analysoida sekvenssien ja taksonien sukulaisuussuhteita useilla eri menetelmillä.
http://paup.csit.fsu.edu/
PDB
(Protein DataBank.)
Makromolekyylien kolmiulotteisten rakenteiden tietokanta. http://www.rcsb.org
PDBSum
PDB-tietokannasta johdettu tietokanta, jonka tietueet sisältävät rakenteen lisäksi yhteenvedon rakenteesta sekä luokitteluja
ja analyysituloksia. http://www.biochem.ucl.ac.uk/bsm/pdbsum/index.html
Pfam
proteiiniperhetietokanta. Proteiinit on jaoteltu sekvenssin mukaisesti perheisiin. Kullekin perheelle tietokanta sisältää
joukon hyvin rinnastettuja sekvenssejä, joiden perusteella luodulla HMM-mallilla muita sekvenssejä voidaan verrata ja luokitella.
http://www.sanger.ac.uk/Software/Pfam/
PHD
Sekvenssiin perustuva proteiinirakenteen ennustusohjelmisto, joka ennustaa annetun sekvenssin sekundäärirakenteen, pintarakenteen
sekä solukalvon läpäisevien sekvenssien sijainnin.
Phylip
Fylogenetiikkaohjelmisto, jonka avulla voidaan analysoida sekvenssien ja taksonien sukulaisuussuhteita useilla eri menetelmillä. http://evolution.genetics.washington.edu/phylip.html
PIR
(Protein Identification Resource)
Sekvenssitietokannoista johdettu tietokanta, joka on tarkoitettu proteiinisekvenssien ja niitä vastaavien nukleiinihapposekvenssien
tunnistamiseen ja analysointiin. http://www-nbrf.georgetown.edu/pir/
ProDom
Tietokanta, joka sisältää automaattisesti luokiteltuja proteiinidomeeniryhmiä. http://www.toulouse.inra.fr/prodom.html
profile alignment
profiilirinnastus
Sekvenssirinnastus, jossa pisteytysmatriisin sijasta tai lisäksi käytetään paikkakohtaista pisteytysmatriisia eli profiilia.
Yleensä profiili tehdään tunnetun monen sekvenssin rinnastuksen perusteella. Profiilirinnastuksessa voidaan pisteytysmatriisiin
perustuvaa rinnastusta paremmin ottaa huomioon tietylle sekvenssiperheelle tyypilliset piirteet.
Prosite
Tietokanta, joka koostuu biologisesti merkittävistä sekvenssijaksoista ja -perheistä sekä niihin liittyvistä sekvenssimotiiveista
ja -profiileista. http://www.expasy.ch/prosite/
PSI-Blast
(Positio Spesific Iterative BLAST)
BLAST-ohjelman versio, joka tekee BLAST-haun perusteella löytyneistä sekvensseistä
sekvenssiprofiilin, jonka avulla ohjelma suorittaa uuden, tarkemman haun. Tulosten perusteella
tehdään uusi sekvenssiprofiili ja haku niin kauan, kunnes merkittävästi samankaltaisia sekvenssejä
ei enää löydy.
PubMed
NCBI:n ylläpitämä bio- ja lääketieteen kirjallisuustietokanta. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi

Q

quartet-puzzling
Heuristinen menetelmä, jonka avulla suurimman uskottavuuden menetelmää voidaan soveltaa suurillekin aineistoille. Menetelmässä
aineistosta määritetään suurinta uskottavuutta vastaavat puut kaikille mahdollisille neljän taksonin ryhmille, joista parhaat
yhdistetään.

R

RNAMOT
Tietokoneohjelma RNA:n primääri- ja sekundäärirakenteiden analyysiin sekä RNA-motiivien etsimiseen. ftp://merck.bch.umontreal.ca/pub/Rnamot/

S

SAR
(structure-activity relationship)
katso structure-activity relationship.
SCOP
(Structural Classification of Proteins)
Tietokanta, jossa PDB:stä löytyvät proteiinirakenteet on ryhmitetty hierarkiseksi kokonaisuudeksi. http://scop.mrc-lmb.cam.ac.uk/scop/
scoring matrix
pisteytysmatriisi
Taulukko, jolla paikasta riippumattomissa sekvenssirinnastusmenetelmissä määritetään eri nukleotidi- tai aminohappoyhdistelmien
vaikutus rinnastuksen laatua tai todennäköisyyttä kuvaavaan pisteytykseen. Katso PAM ja BLOSUM.
secondary structure
sekundäärirakenne
Proteiinissa paikallisesti esiintyvät säännölliset kolmiulotteiset rakenteet. Yleisimmät sekundäärirakenteet ovat alfa-kierre
ja beta-säie.
SeqLab
GCG-ohjelmistopaketin X-yhteyden kautta käytettävä käyttöliittymä.
SeqWeb
GCG-ohjelmistopaketin verkkoselaimen kautta käytettävä käyttöliittymä. Esim. CSC:n SeqWeb rekisteröidyille käyttäjille: https://seqweb.csc.fi/gcg-bin/seqweb.cgi
Simwalk
Ohjelma sekä parametriseen että ei-parametriseen kytkentäanalyysiin. Toisin kuin Genehunteria, ohjelmaa voi käyttää myös suurille
sukupuille.
sliding window
liukuva ikkuna
Sekvenssianalyysissä: tarkastelualue. Sekvenssiä käydään läpi ikkunan pituisissa palasissa niin, että ensimmäinen ikkuna alkaa
ensimmäisestä sekvenssikohdasta ja analyysin edetessä ikkunaa liu’utetaan kohta kerrallaan eteenpäin sekvenssissä.
Smith-Waterman algorithm
Smithin ja Watermanin algoritmi
Dynaamiseen ohjelmointiin perustuva sekvenssien rinnastusmenetelmä. Algoritmi etsii kahden sekvenssin väliset parhaat mahdolliset
paikalliset rinnastukset.
Solar
Kytkentäanalyysiohjelma, joka on suunniteltu määrällisiin ominaisuuksiin vaikuttavien geenien paikallistamiseen.
SOM
(Self Organizing Map)
Itseorganisoituva kartta
Yksi hermoverkkomenetelmien sovellus.
SRS
(Sequence Retrieval System)
WWW-ympäristössä toimiva sekvenssihakutyökalu. Esimerkiksi:
http://srs.csc.fi:8002
Staden
Molekyylibiologisen aineiston analyysityökalupaketti. Erityisen sovelias automaattisekvensaattoriaineiston käsittelyyn.
stringency
ankaruus, vaativuus
Molekyylibiologiassa kuvaa usein sekvenssikoettimen sitoutumisolosuhteita tai sekvenssianalyyseissä vaadittavien pisteiden
määrää esim. tarkasteluikkunassa.
structure-activity relationship
(SAR)
rakenne-aktiivisuus-vuorovaikutus
SAR-menetelmissä käytetään tilastollisia menetelmiä rakenteellisten tekijöiden sekä ligandin tai proteiinin aktiivisuuden
vastaavuuden arviointiin.
substitution matrix
pisteytysmatriisi
Taulukko, jolla paikasta riippumattomissa sekvenssirinnastusmenetelmissä määritetään eri nukleiini- tai aminohappoyhdistelmien
vaikutus rinnastuksen laatua tai todennäköisyyttä kuvaavaan pisteytykseen. Katso scoring matrix.
sum of pairs score
parisummapisteytys
Monen sekvenssin rinnastuksessa käytettävä pisteytysmenetelmä, jossa sarakkeen
pistemäärä lasketaan kaikkien sarakkeessa olevien emäs/aminohappoparien parittaisten vertailujen
pisteytysten summana. Esim. kolmen sekvenssin, A B C, tapauksessa parisummapisteytys on
(A+B)+(A+C)+(C+B).
SWISS-PROT
Proteiinisekvenssitietokanta, jossa on pyritty hyvin jäsenneltyyn proteiinisekvenssien ja niihin liittyvän tiedon kuvailuun.
Sekvenssin lisäksi SWISS-PROT-tietueet sisältävät tietoa mm. proteiinin toiminnasta, alayksiköistä sekä vastaavista mutatoiduista
proteiineista. http://www.expasy.ch/sprot/

T

TCP/IP
(Transport Control Protocol/Internet Protocol)
Yksi Internetin käyttämistä tiedonsiirtokäytännöistä.
twilight zone
hämärän alue
Käytetään sekvenssivertailussa kuvaamaan sekvenssien samankaltaisuutta, kun niiden identtisyys on alle 25 prosenttia. Tämänasteinen
samankaltaisuus voi olla sattumaa.

U

UPGMA
(Unweighted Pair Group Method using arithmethic Averages). Yksinkertainen puukaavion muodostusalgoritmi. Menetelmää on käytetty
mm. geneettisiin etäisyyksin perustuvassa fylogenetiikka-analyysissä.

V

Viterbi-agorthm.
Viterbin alogritmi
Laskee todennäköisimmän polun kätketyn Markovin mallin läpi. Viterbin alogritmia
käytetään kätkettyjen Markovin mallien yhteydessä parhaimman sekvenssirinnastuksen etsintään.
Algoritmi muistuttaa sekä rakenteeltaan, että käytöltään paljolti dynaamisen optimoinnin
(Needlemanin ja Wunschin algoritmi) käyttöä pisteytysmatriisimenetelmien yhteydessä.

W

W2H
GCG- ja EMBOSS-ohjelmistojen verkkoselainkäyttöliittymä. http://www.w2h.dkfz-heidelberg.de/
weight
painotus, paino
Bioinformatiikan algoritmeissä kerroin, jonka mukaan tiettyä
tekijää painotetaan suhteessa muihin tekijöihin. Esimerkiksi profiilirinnastuksessa
tiettyyn sekvenssikohtaan sidottu painoarvo.

X

XML
(Extensible Markup Language),
Yleinen standardiformaatti, jolla voidaan kuvata rakenteista
aineistoa ja dokumentteja tekstimuodossa.
XML on suuniteltu erityisesti helpottamaan rakeenteellisen aineiston siirtoa ja
esittämistä WWW-järjestelmässä.
Xplor
Ohjelma, jota käytetään biologisten makromolekyylien rakenteen hienonnus- ja määrittelylaskuihin röntgenkristallografiassa
ja NMR-spektroskopiassa.

Z

Z-score
Z-arvo
Yleinen sekvenssianalyysiohjelmien parametri, jota käytetään arvioitaessa tietokannasta löytyneen sekvenssin ja hakusekvenssin
välistä suhdetta. Z-arvo kuvaa sitä todennäköisyyttä, jolla yhtä samankaltainen sekvenssi voidaan löytää sattumalta.
Z-value
katso Z-score.