Pētniecības metodes Genomu sekvenču iegūšana un analīze. Attīstoties sekvencēšanas tehnoloģijām un pieaugot pieejamo DNS un proteīnu aminoskābju sekvenču skaitam, radās nepieciešamība tās apstrādāt, uzglabāt un analizēt. Tādēļ bioinformātikas pētījumi genomu analīzes kontekstā izmanto metodes, kas vērstas uz genomu sekvenču savākšanu (assembly), genomu anotāciju, genomu un ar tiem saistītās informācijas datu bāzu izveidi un uzturēšanu, datubāzu meklēšanas sistēmu un dažādu genomu analīzes rīku izveidi. Viena no pirmajām datorprogrammām, kas izmantota DNS sekvenču savākšanai un kuru bija iespējams izmantot personālajā datorā, bija Steidena pakete (Staden package, 1977). Mūsdienās genoma sekvencēšanas dati tiek apstrādāti ar jaudīgām datorsistēmām. Piemēram, ASV kompānijas Celera, kas paralēli Cilvēka genoma projektam noteica cilvēka genoma sekvenci, rīcībā 1999. gadā bija pasaulē trešā lielākā un civilajām vajadzībām lielākā izmantotā datorsistēma. Proteīnu aminoskābju un DNS nukleotīdu sekvences, sākot no 20. gs. 80. gadiem, tika uzglabātas publiski pieejamās datu bāzēs. Pasaulē ir trīs primārās DNS datu bāzes: ASV Nacionālā biotehnoloģijas informācijas centra GenBank (National Center for Biotechnology Information GenBank) datu bāze, Eiropas Bioinformātikas institūta Eiropas nukleotīdu arhīvs (European Bioinformatics Institute European Nucleotide Archive) un Japānas DNS Datu banka (DNA Data Bank of Japan). Datubāzu saturs tiek regulāri sinhronizēts, un tas ir publiski pieejams internetā. Statistikas dati par GenBank datu bāzi 2017. gada oktobrī rāda, ka tā satur 203 953 682 sekvences ar kopējo garumu 244 914 705 468 nukleotīdi.
Gēnu darbības regulācijas un ekspresijas analīze. Attīstoties augstas caurlaides spējas analītiskajām metodēm, kļuva iespējams vienlaicīgi analizēt kopējo gēnu ekspresijas dinamiku un atšķirības atkarībā gan no ārējiem, gan iekšējiem stimuliem un faktoriem – radās transkriptomas analīze (transcriptomics). Galvenais marķieris gēnu ekspresijas izmaiņām ir matricas RNS (mRNS) daudzums. mRNS kvantitatīvai analīzei tiek izmantotas dažādas augstas caurlaides spējas metodes un to kombinācijas – mikrorindu analīze (microarray), masīvā paralēlā sekvencēšana un RNS-sekvencēšana. Metožu jutības un tehnoloģisku ierobežojumu dēļ šīs metodes ietver lielu fona līmeņa klātbūtni. Viena no pirmajām transkriptomas platformām, kas ļāva veikt vienlaicīgu vairāku tūkstošu vai pat desmitu tūkstošu gēnu ekspresijas analīzi, bija ASV uzņēmuma Affymetrix 20. gs. 90. gados komercializētā GeneChip platforma, kas vienā paketē apvienoja gan pašu GeneChip mikrorindu, gan hibridizācijas iekārtas un GeneChip skeneri, gan arī bioinformātikas rīkus gēnu ekspresijas analīzei. Bioinformātikas pieeja tiek izmantota gan eksperimentālajam dizainam (lietoto zondu konstrukcijai), gan datu analīzei (fona atfiltrēšanai). Mikrorindu metožu pielietošanai izveidoti brīvpieejas interneta resursi, kas nosaka vienotu standartu eksperimentiem un datu interpretācijai. Tā kā gēnu ekspresijas pamatā ir DNS (gēnu ekspresijas regulācijas elementu) un proteīnu (transkripcijas faktoru) mijiedarbība, izveidotas metodes, kas palīdz noteikt, kādi proteīni piesaistīti DNS, kādā funkcionālā stāvoklī un kuri no tiem var mijiedarboties ar noteiktiem DNS reģioniem. Šo metožu pamatā ir hromatīna imunoprecipitācijas metodes (chromatin imunoprecipitation – ChIP) variācijas.
Bioinformātikas izmantojums struktūrbioloģijā palīdz noteikt un prognozēt proteīnu struktūru un spriest par analizēto proteīnu funkcijām. Biežāk izmantotās eksperimentālās metodes, kas datus analizē struktūrbioloģijā, ir rentgenstaru kristalogrāfija un kodolmagnētiskā rezonanse. Eksperimentālie dati tiek izmantoti, lai noteiktu proteīna sekundāro, terciāro un kvartāro struktūru. Proteīnu trīsdimensiju struktūras tiek apkopotas un publicētas interneta brīvpieejas resursos, piemēram, Proteīnu datu bankā (Protein Data Bank, PDB). Paralēli eksperimentālo datu analīzei struktūrbioloģijā tiek izmantotas arī bioinformātikas metodes, kas ļauj prognozēt proteīna telpisko struktūru, balstoties uz primāro aminoskābju sekvenci. Izplatītākā un precīzākā ir homoloģijas modelēšana (homology modeling), kad, zinot proteīnu kodējošo aminoskābju sekvenci, iespējams šo sekvenci pielāgot (threading) evolucionāri vai molekulāri radnieciskam proteīnam ar zināmu struktūru un tādējādi paredzēt pētāmā proteīna struktūru. Tiek izmantotas arī de novo (latīņu ‘no jauna’) vai ab initio (latīņu ‘no sākuma’) metodes, kas balstās uz struktūras paredzēšanu tikai atkarībā no aminoskābju secības proteīnā, neizmantojot eksperimentālos vai homoloģijas datus. Pamatā visām struktūrbioloģijas pieejām ir termodinamiskā hipotēze, ka aminoskābju virkne proteīnā cenšas ieņemt stāvokli ar minimālu iekšējo brīvo enerģiju. Bioinformātikas metodes šajā gadījumā palīdz aprēķināt iespējamos brīvās enerģijas variantus potenciālajās struktūrās un atrast struktūras modeli ar potenciāli zemāko brīvo enerģiju. Šādas programmas (SWISS-MODEL, PSIPRED u. c.) pieejamas interneta resursos.
Sistēmbioloģija ir bioloģisko sistēmu matemātiska modelēšana, kas cenšas iegūt priekšstatu par bioloģisko sistēmu kā vienotu veselumu. Attīstoties analītiskajām augstas caurlaides spējas metodēm, iespējams iegūt pilnīgu informāciju par organisma genoma sekvenci, visu gēnu ekspresijas līmeni noteiktās šūnās un audos, kā arī par proteīnu un metabolītu līmeņiem šūnās. Lai integrētu un analizētu eksperimentālos datus no dažādiem avotiem vai par vairākiem molekulārās bioloģijas pamatelementiem (DNS, RNS, proteīniem), tiek lietotas specifiskas sistēmbioloģijas pētniecības metodes. Parasti bioinformātikas pieeja sistēmbioloģijai ietver signālceļu, tīklu un mijiedarbību identifikāciju lielā datu apjomā. Šādā veidā tiek pētītas proteīnu-proteīnu un citu pamatelementu mijiedarbības, metabolisma ceļi, gēnu ekspresijas un regulācijas tīkli, kā arī šūnas signālu pārnese. Bioinformātikas metodes sistēmbioloģijā tiecas veidot virtuālu šūnas, tās funkcijas vai organisma modeli, integrējot eksperimentālo un informācijas tehnoloģiju pieeju, lai spriestu par sistēmas kopējiem darbības principiem un identificētu būtisko pamatelementu un funkciju virkni, kā arī lai prognozētu sistēmas funkcionēšanu konkrētos apstākļos.
Informācijas meklēšanas sistēmas. Sākotnēji publiskajās genoma datu bāzēs pieejamā informācija tika izplatīta lielākajām pasaules universitātēm un bibliotēkām datoru diskešu un kompaktdisku formā, taču globālā tīmekļa izveide atļāva tām piekļūt katram interneta lietotājam. Lai atvieglotu informācijas meklēšanu un datu analīzi, NCBI un EBI izveidotas integrētas meklēšanas sistēmas, kas ļauj meklēt informāciju gan pēc atslēgas vārdiem, gan pēc sekvenču homoloģijas vienlaicīgi visās saistītajās datu bāzēs. Piemēram, DNS sekvenču datu bāzes ir saistītas ar proteīnu aminoskābju sekvenču, atbilstošo proteīnu telpisko struktūru, DNS variācijas, gēnu ekspresijas, zinātniskās literatūras u. c. datubāzēm. Meklējot kādas sugas organisma noteiktu gēnu, iespējams atrast arī saistīto informāciju par šī gēna kodēto proteīnu un atbilstošo zinātnisko literatūru. Meklēšanu iespējams veikt, izmantojot atslēgas vārdus vai meklējot datu bāzē DNS vai proteīnu aminoskābju sekvencei homologās sekvences. DNS un to kodētās proteīnu aminoskābju sekvences dažādos dzīvos organismos ir ar kopīgu izcelsmi, attiecīgi tās var būt līdzīgas (homologas). Populārākie homoloģijas meklēšanas rīki ir BLAST (Basic Local Sequence Alignment Tool) un FASTA. Mūsdienās daudzi saistītie datu resursi gan struktūru bioloģijā, gan sistēmbioloģijā atrodami interneta brīvpieejas meklēšanas sistēmās, kas ļauj brīvu datu apriti un veicina pētniecības attīstību.