Biyoinformatik, biyolojik bilgilerin yaratılması ve saklanması için veritabanlarının oluşturulmasıdır.Bu konudaki çalışmaların çoğu biyolojik verilerin analizi ile ilgilidir. Artan sayıdaki projelerde biyolojik bilgilerin organizasyonu gerekmektedir. Bu alanda oluşturulan veritabanlarının büyük bir kısmını nükleik asitler oluşturmaktadır.
Milyonlarca nükleotidin depolanması ve organizasyonu için veritabanlarının oluşturulması, araştırıcıların bu bilgilere ulaşabilmeleri ve yeni veriler girebilmeleri için ilk aşamadır. Biyoinformatik’te nükleotid dizi bilgilerinin organizasyonu ve depolanması görevini üstlenmiş üç kuruluş vardır. Genbankası (GenBank), Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) ve DNA Japonya veritabanıdır (DDBJ). Bu üç kuruluş, araştırıcıların yararlanmasına açık, nükleotid dizi bilgilerinin toplanması ve yayılmasında işbirliği içinde çalışmaktadır. Gen Bankası ABD’de Maryland, Bethesda’da, Avrupa Moleküler Biyoloji Laboratuvarı, İngiltere’deki Hinxton’da ve DNA Japonya veritabanı ise Japonya’da Mishima’da yeni dizi bilgilerinin alışverişinde,İnternet üzerinde günlük olarak e-mail, ortak kullanılan ftp ve www üzerinden hizmet sunmaktadırlar. Protein dizi verileri ile ilgili başlıca hizmet sağlayıcılar ise GenBank, EMBL, PIR International ve Swiss-Prot’tur. NIH’in National Center for Biotechnology Information merkezi, biyoinformatik gereci sunan başlıca web sayfalarından biridir. Ve günde 3 milyon araştırmacı tarafından ziyaret edilmektedir.
Veritabanlarındaki bazı sorunlar; vektöriyel dizilerle kirlilik, bir gene ait dizi parçaçıklarının veritabanına birden çok kez girilmesi ile ortaya çıkan kalabalık, aynı gene ait birden fazla EST (Ekspressed Sequence Tag) içeren EST veritabanlarının olması gibi durumlardır. Bu durumlar; genom projelerinin ileri aşamalarını oluşturan UNIGENE, VecScreen gibi projelerle ortadan kaldırılmaya çalışılmaktadır.
Biyoinformatiğin ikinci özelliği; saklanan biyolojik bilgilerin analizidir. Analiz kapsamına giren konular;