Các nhà khoa học vẫn chưa biết rõ về gần 2 triệu protein, theo một cơ sở dữ liệu di truyền mới  

Giúp NTDVN sửa lỗi

Khi nói đến các lĩnh vực rộng lớn chưa được khám phá, người ta thường nghĩ đến không gian xa xôi và đại dương sâu thẳm. Nhưng chính bản thân chúng ta, cơ thể người, vẫn còn rất nhiều bí ẩn. Một cơ sở dữ liệu di truyền mới có tên là “unknome” cho thấy, số lượng protein chúng ta chưa biết rõ lên tới gần 2 triệu, theo Science News.

Cơ sở dữ liệu này, đã được công khai, xếp hạng các nhóm protein dựa trên mức độ mà chúng ta chưa biết về chúng. Thông tin này có thể giúp các nhà khoa học xác định protein nào cần nghiên cứu trong tương lai, bao gồm cả việc điều trị bệnh và phát triển thuốc.

Theo Science News, nhà sinh học tế bào Sean Munro và các đồng nghiệp đã biên soạn cơ sở dữ liệu unknome - một từ ghép của "unknown" (chưa biết) và "genome" (gen) - để xác định các protein và gen mã hóa protein tương ứng chưa được nghiên cứu kỹ nhưng có thể rất quan trọng.

Protein thường được nhóm thành các họ có tổ tiên tiến hóa chung. Cơ sở dữ liệu unknome chứa tất cả các họ protein có ít nhất một protein được mã hóa bởi bởi bộ gen của con người, hoặc bởi bộ gen của 11 sinh vật thường được nghiên cứu khác. Nó chứa tới hơn 13.000 nhóm và gần 2 triệu protein.

Theo Science News, cơ cở dữ liệu unknome chấm điểm các nhóm protein dựa trên mức độ thông tin đã biết về gen tương ứng. Khoảng 3.000 nhóm trong số đó, bao gồm 805 nhóm chứa ít nhất một protein của người, có điểm số là 0. Điều này cho thấy vẫn còn nhiều điều cần tìm hiểu về bộ gen của chúng ta.

Munro và các đồng nghiệp đã sử dụng cơ sở dữ liệu này để nghiên cứu 260 gen chung giữa ruồi giấm và con người có điểm số thấp. Sau khi làm giảm hoạt động của từng gen mã hóa protein ở ruồi, các nhà nghiên cứu phát hiện ra khoảng 60 gen là cần thiết cho sự sống. Các gen khác rất quan trọng cho quá trình sinh sản, tăng trưởng, vận động và khả năng phục hồi trước căng thẳng.

Munro, thuộc Phòng thí nghiệm Sinh học Phân tử của Hội đồng Nghiên cứu Y khoa ở Cambridge, Anh, cho biết: “Ngay cả ở những [sinh vật] được nghiên cứu kỹ lưỡng như ruồi, vẫn có những điều mới để khám phá”.

Nhà khoa học dữ liệu Tudor Oprea của Expert Systems Inc., một công ty nghiên cứu thuốc ở San Diego, người không tham gia vào nghiên cứu, cho biết, vẫn chưa rõ một số hoặc tất cả các gen đó có tác dụng tương tự ở người hay không. Tuy nhiên, cơ sở dữ liệu có thể giúp các nhà nghiên cứu tìm ra các protein quan trọng của con người bằng cách nhanh chóng sàng lọc các protein tương tự ở các sinh vật dễ nghiên cứu hơn như ruồi giấm,.

Munro cho biết bước tiếp theo đối với nhóm của ông là hợp tác với những nỗ lực tương tự như Understudied Proteins Initiative (Tạm dịch: Sáng kiến ​​Protein Chưa được Nghiên cứu) để nghiên cứu quy mô lớn về những protein bí ẩn này.


Nghiên cứu được đăng trên PLOS Biology.

Theo Science News

Văn Thiện biên dịch



BÀI CHỌN LỌC

Các nhà khoa học vẫn chưa biết rõ về gần 2 triệu protein, theo một cơ sở dữ liệu di truyền mới