บทคัดย่อ
วัณโรคยังคงเป็นโรคติดเชื้อที่สร้างปัญหาทางสาธารณสุขและส่งผลกระทบต่อสังคมและเศรษฐกิจของประเทศไทยอย่างมาก การศึกษาระบาดวิทยาและชีววิทยาของเชื้อวัณโรค การตรวจวินิจฉัยวัณโรคดื้อยา รวมถึงการวางแผนการรักษาโรคจึงเป็นสิ่งจำเป็นอย่างยิ่งต่อการป้องกันและควบคุมการแพร่กระจายของโรค วิธีการจำแนกเชื้อด้วยเครื่องหมายทางพันธุกรรมหรือวิธีจีโนไทป์ โดยเฉพาะสนิปส์ได้ถูกนำมาใช้ศึกษาระบาดวิทยาของเชื้อวัณโรคอย่างกว้างขวาง รวมทั้งใช้ในการศึกษาวิวัฒนาการของเชื้อและใช้ทำนายการดื้อยา งานวิจัยจากโครงการในปีที่ 1 ได้พัฒนาวิธีวิเคราะห์ข้อมูลทั้งจีโนมของเชื้อวัณโรค เพื่อใช้ทำนายการดื้อยาต้านวัณโรคกลุ่มยาหลัก ได้แก่ isoniazid, rifampicin, streptomycin และ ethambutol และทำการวิเคราะห์เพื่อจำแนกสายพันธุ์เชื้อวัณโรค เปรียบเทียบผลที่ได้กับวิธีมาตรฐาน ผลการทดลองพบว่าวิธีวิเคราะห์ข้อมูลจีโนมเพื่อทำนายการดื้อยามีความไว ความจำเพาะที่ร้อยละ 94.6 และ 98.5 สำหรับยา isoniazid ร้อยละ 92.4 และ 99.6 สำหรับยา rifampicin ร้อยละ 85.3 และ 98.9 สำหรับยา streptomycin และร้อยละ 66.7 และ 97.9 สำหรับยา ethambutol ตามลำดับและจำแนกสายพันธุ์เชื้อได้ถูกต้องเทียบเท่ากับวิธีมาตรฐาน นอกจากนี้ยังสามารถรวบรวมข้อมูลสนิปส์ที่เกี่ยวข้องกับการดื้อยาและที่ใช้จำแนกสายพันธุ์เพื่อนำไปสร้างฐานข้อมูลสำหรับใช้ในกระบวนการวิเคราะห์ งานวิจัยในปีที่ 2 ได้ทำการพัฒนากระบวนการวิเคราะห์แบบอัตโนมัติโดยใช้องค์ความรู้ที่ได้จากงานวิจัยในปีแรก เพื่อใช้ทำนายการดื้อยาและจำแนกสายพันธุ์เชื้อวัณโรคและทดสอบกับเชื้อวัณโรคกลุ่มทดสอบจำนวน 50 สายพันธุ์ ประกอบด้วยเชื้อวัณโรคดื้อต่อยา isoniazid rifampicin streptomycin และ ethambutol จำนวน 41, 43, 23 และ 27 สายพันธุ์ ตามลำดับและดื้อต่อยาในกลุ่มยาสำรอง (second-line drug) ได้แก่ amikacin kanamycin ยากลุ่ม fluoroquinolones ethionamide และ PAS จำนวน 12, 13, 25, 11 และ 15 สายพันธุ์ ตามลำดับ ผลที่ได้พบว่ากระบวนการวิเคราะห์แบบอัตโนมัติสามารถทำนายการดื้อยา isoniazid rifampicin streptomycin และ ethambutol โดยมีความไวและความจำเพาะอยู่ระหว่างร้อยละ 82.6–92.6 และ 87.0-100 ตามลำดับ แต่มีความไวต่ำกว่าสำหรับการทำนายการดื้อยากลุ่มยาสำรอง โดยมีค่าความไวและความจำเพาะอยู่ระหว่างร้อยละ 66.7-80.0 และ 92.0-100 ตามลำดับและยังสามารถจำแนกสายพันธุ์เชื้อได้อย่างถูกต้องเทียบเท่ากับวิธีมาตรฐาน
บทคัดย่อ
Tuberculosis (TB) remains a public health problem in Thailand and causes socio-economic consequences. Studying of epidemiology and biology of Mycobacterium tuberculosis, a causative agent of TB, development of rapid diagnosis of drug-resistant TB, and effective treatment are urgently required for effective prevention and control of TB. Genotyping of M. tuberculosis strain based on specific genomic markers has been widely used for epidemiological study. Particularly, single nucleotide polymorphisms (SNPs) are current genomic markers appropriate for epidemiological and evolutional study and also for prediction of drug resistance. From the first-year study, we could develop the whole genome sequence analysis pipeline for prediction of resistance to first-line anti-TB drugs (isoniazid, rifampicin, streptomycin and ethambutol) and for rapid genotyping. Comparison with results obtained from standard drug susceptibility testing, the analysis pipeline had sensitivity and specificity of 94.6% and 98.5% for isoniazid, of 92.4% and 99.6% for rifampicin, of 85.3% and 98.9% for streptomycin, and of 66.7% and 97.9% for ethambutol, respectively. For genotyping the pipeline showed 100% concordant results with the standard LSP. In addition, SNPs databases for drug resistance and genotyping were created from this study. In the second year of the study, the automatic genome analysis pipeline for prediction of drug resistance and for genotyping was developed and validated with a test sample set of 50 M. tuberculosis strains comprising of 41 isoniazid-, 43 rifampicin-, 23 streptomycin-, 27 ethambutol-, 12 amikacin-, 13 kanamycin-, 25 fluoroquinolone-, 11 ethionamide- and 15 PAS-resistant strains. Results were compared with those obtained from the standard drug susceptibility testing and revealed the sensitivity and specificity from 82.6 to 92.6% and from 87.0 to 100%, respectively, for prediction of first-line anti-TB drugs. The sensitivity was lower for prediction of second-line drugs; sensitivity and specificity ranged from 66.7 to 80.0% and from 92.0 to 100%, respectively. The automatic genome analysis pipeline also showed 100% concordant results with the standard LSP for genotyping.