विषय
जीनोमिक्स आनुवंशिकी की एक शाखा है जो जीवों के जीनोम में बड़े पैमाने पर परिवर्तन का अध्ययन करती है। जीनोमिक्स और इसके सबफील्ड ऑफ़ ट्रांसक्रिपटॉमिक्स, जो आरएनए में जीनोम-व्यापक परिवर्तनों का अध्ययन करते हैं, जो डीएनए से स्थानांतरित होता है, कई जीनों का अध्ययन एक बार होता है। जीनोमिक्स में डीएनए या आरएनए के बहुत लंबे अनुक्रमों को पढ़ना और संरेखित करना भी शामिल हो सकता है। ऐसे बड़े पैमाने पर जटिल डेटा का विश्लेषण और व्याख्या करना, कंप्यूटर की मदद की आवश्यकता है। मानव मन, जैसा कि शानदार है, इस जानकारी को संभालने में असमर्थ है। जैव सूचना विज्ञान एक हाइब्रिड क्षेत्र है जो जीव विज्ञान के ज्ञान और सूचना विज्ञान के ज्ञान को एक साथ लाता है, जो कंप्यूटर विज्ञान का एक उप-क्षेत्र है।
जीनोम में बहुत सारी जानकारी होती है
जीवों के जीनोम बहुत बड़े होते हैं। मानव जीनोम में तीन बिलियन बेस जोड़े होने का अनुमान है जिसमें लगभग 25,000 जीन होते हैं। तुलना के लिए, फल मक्खी में 165 बिलियन आधार जोड़े होने का अनुमान है, जिसमें 13,000 जीन हैं। इसके अतिरिक्त, जीनोमिक्स के एक उपक्षेत्र को ट्रांसक्रिपटॉमिक्स अध्ययन कहा जाता है जो एक जीव में हजारों की संख्या के बीच जीन, एक निश्चित समय पर, कई समय बिंदुओं पर और प्रत्येक समय बिंदु पर कई प्रयोगात्मक स्थितियों को चालू या बंद कर देता है। दूसरे शब्दों में, "omics" डेटा में बड़ी मात्रा में जानकारी होती है जिसे मानव मन जैव सूचना विज्ञान में कम्प्यूटेशनल विधियों की सहायता के बिना समझ नहीं सकता है।
जैविक डेटा
आनुवांशिक शोध के लिए जैव सूचना विज्ञान महत्वपूर्ण है क्योंकि आनुवांशिक आंकड़ों का एक अर्थ है। कॉन बायोलॉजी है। जीवन रूपों में व्यवहार के कुछ नियम होते हैं। यही बात ऊतकों और कोशिकाओं, जीनों और प्रोटीनों पर भी लागू होती है। वे कुछ तरीकों से बातचीत करते हैं और एक दूसरे को कुछ तरीकों से विनियमित करते हैं। बड़े पैमाने पर, जटिल डेटा जो कि जीनोमिक्स में उत्पन्न होता है, यह समझ में नहीं आता है कि जीवन के रूप में यह कैसे काम करता है। जीनोमिक्स द्वारा उत्पन्न डेटा का विश्लेषण इंजीनियरों और भौतिकविदों द्वारा उपयोग किए जाने वाले तरीकों द्वारा किया जा सकता है, जो वित्तीय बाजारों और फाइबर ऑप्टिक्स का अध्ययन करते हैं, लेकिन डेटा का इस तरह से विश्लेषण करने से समझ में आता है कि जीव विज्ञान के ज्ञान की आवश्यकता है। इस प्रकार, जैव सूचना विज्ञान ज्ञान का एक अमूल्य संकर क्षेत्र बन गया।
हजारों की संख्या में क्रंच करना
नंबर क्रंचिंग यह कहने का एक तरीका है कि कोई गणना कर रहा है। बायोइंफॉर्मेटिक्स कुछ ही मिनटों में दसियों हज़ारों की संख्या को क्रंच करने में सक्षम है, यह इस बात पर निर्भर करता है कि कंप्यूटर कितनी तेजी से सूचना को संसाधित कर सकता है। ओमिक्स अनुसंधान कंप्यूटरों का उपयोग एल्गोरिदम - गणितीय गणनाओं को चलाने के लिए करता है - बड़े डेटा सेटों में पैटर्न खोजने के लिए बड़े पैमाने पर। सामान्य एल्गोरिदम में श्रेणीबद्ध क्लस्टरिंग (संदर्भ 3 देखें) और प्रमुख घटक विश्लेषण जैसे कार्य शामिल हैं। दोनों नमूनों के बीच संबंधों को खोजने की तकनीक है जिसमें उनके कई कारक हैं। यह निर्धारित करने के समान है कि क्या कुछ जातीयता एक फोन बुक में दो खंडों के बीच अधिक आम है: अंतिम नाम जो कि ए बनाम अंतिम नामों से शुरू होते हैं जो बी से शुरू होते हैं।
सिस्टम बायोलॉजी
जैव सूचना विज्ञान ने यह अध्ययन करना संभव बना दिया है कि कैसे एक प्रणाली जिसमें हजारों चलने वाले भाग होते हैं, एक बार में सभी भागों के स्तर पर व्यवहार करते हैं। यह एक तरह से पक्षियों के झुंड को यूनिसन में उड़ते हुए या मछली के एक स्कूल में तैरते हुए देखने जैसा है। पहले, आनुवंशिकीविदों ने एक समय में केवल एक जीन का अध्ययन किया था। हालांकि उस दृष्टिकोण में अभी भी एक अविश्वसनीय रूप से योग्यता है और ऐसा करना जारी रखेगा, जैव सूचना विज्ञान ने नई खोजों के लिए अनुमति दी है। सिस्टम बायोलॉजी कई चलते भागों को मापकर एक जैविक प्रणाली का अध्ययन करने के लिए एक दृष्टिकोण है, जैसे पक्षियों की विभिन्न जेबों की सामूहिक गति का अध्ययन करना जो एक बड़े, झुंड के झुंड के रूप में उड़ रहे हैं।