发布时间:2022-08-16
病毒插入造成的突变是疾病产生非常常见的原因.在我国,乙肝病毒携带者数量非常庞大,乙型肝炎导致的肝癌是我国肝癌发病率较高的原因之一.随着新一代测序技术的发展和成熟,使得通过测序来检测病毒对基因组的影响,进而探究病毒插入基因组致病的发病机理成为可能。
通过与参考基因组的比对挑选出相应的读段,筛选并与病毒重比对等方法建立了一套病毒插入位置探测的流程及软件.该算法能够使用全基因组测序数据探测病毒在人类基因组中的插入情况:
使用软断裂(soft clip)通过对两端序列的多次匹配确定病毒的插入位置。
2.使用配对异源序列,对同一个DNA片段上的两条读段在不同基因组上进行定位,模糊判断病毒插入位置。
3.使用序列的匹配质量对部分插入位点的可信度进行评估。
4.对插入点附近的完美匹配读段的覆盖度利用伯努利检验进行检验,评估插入的可信度。
5.对于检验不通过的位点,通过重头组装的方法对附近位置的读段序列进行了拼接,并通过blast对拼接后的序列进行搜索,进一步探究了问题位点的形成原因与分布情况。