
中前和恭1,2
1 広島大学ゲノム編集イノベーションセンター プラチナバイオ共同研究講座 バイオDX研究室
2 プラチナバイオ株式会社 研究開発部)
―――――――――――――――――――――――――――――――――――
ゲノム編集サンプルの解析ソフトウェア開発状況
―――――――――――――――――――――――――――――――――――
第3世代のゲノム編集ツールであるCRISPR-Cas9システムが登場して早十年が経とうとしている。その間、ゲノム編集技術は急速に進展し、現在では非常に多様なアプリケーションが登場するに至っている。それに伴いゲノム編集の解析を支援するためのバイオインフォマティクスツールも数々登場してきた。今回のメールマガジンにおいては、ゲノム編集のサンプルで利用される代表的なソフトウェアについて論じつつ、近年の研究動向についても触れたい。
まずゲノム編集サンプルの解析に関わるソフトウェアの中で代表的なものをカテゴライズするとすれば、 (1) TIDE解析ツール、(2) NGSによるアンプリコンシーケンス解析ツール、(3) ロングリードシーケンサーによるアンプリコンシーケンス解析ツール、(4) Genome-wideオフターゲット解析ツール、がある。それぞれについて項目に分けて述べたい。
(1) TIDE解析ツール
TIDE解析ツールはサンガーシーケンスのシーケンストレースデータを解析して、サンプルに含まれる変異種とその割合を推定するツールである。代表的なツールとしてTIDE [1]があり、他にもICE [2]やDECODR [3]がある。またTIDER [4]やICE [2]、DECODR [3]では特定の一塩基置換あるいは挿入の解析にも対応している。また、TIDE [1]は基本的にインデルの定量にフォーカスを置いているが、置換の割合にフォーカスした類似ツールとしてはEditR [5]というツールが存在している。このEditR [5]は元来Base Editingサンプルの解析を目的として作られたツールではあるが、非公式的にPrime Editingによる塩基置換解析でも利用例 [6–9]が報告されている。
TIDE [1]の基本的な利用方法についてはTogoTV [10]にて解説動画(https://doi.org/10.7875/togotv.2021.040)がアップロードされているため是非とも参照されたい。
TIDE [1]やICE [2]は、内部的にはシーケンストレースデータに対する統計的な計算(想定される複数のインデルのシーケンストレースデータを説明変数とした重回帰分析)を実施している関係で、2つ以上のインデル種が含まれるポピュレーション(Bulk)サンプルでも解析が可能である。その一方で、PolyPeakParser [11]やCRISP-ID [12]は、シーケンストレースデータのセカンドピークを読み取って2種類のアレル配列に分離することを行うため、クローニングした二倍体細胞をジェノタイピングする場合に適している。このように似たようなツールであっても対象サンプルや出現する変異種によって適不適があるため、各ツールの原著論文を参照して最適なものを検討することをお勧めしたい。
(2) NGSによるアンプリコンシーケンス解析ツール
NGSによるアンプリコンシーケンス(Deep sequencing)解析は、ゲノム編集標的で生じた変異アレルを高解像度に定量する手法として知られる。解析の方法としては、マッピングツールBWA-MEM [13]と変異検出ツールGenome Analysis ToolKit(GATK) [14]を用いた標準的なバイオインフォマティクス解析方法 [15,16]に加えて、CRISPResso2 [17]のようなゲノム編集を前提にしたインデルや置換の分類解析ができるツールで解析を行う場合もある。CRISPResso2 [17]は継続的にアップデートが行われており、現在はCRISPR-Cas9の解析のみならず、Base Editing [18,19]やPrime Editing [20]の解析も可能である。CRISPResso2 [17]は基本的にNGSのアンプリコンシーケンスデータ(.fastq)とアンプリコン配列情報、プロトスペーサー配列(認識配列)情報だけで解析ができるため、Cas12fやZF-DdCBEなどの新規ツールでの変異解析 [21,22]でも利用されることがある。そうした背景も相まってか、原著論文の引用数は400件を超えており、このカテゴリのグローバルスタンダードといって差し支えないだろう。ちなみに、CRISPResso2 [17]のリード分類結果をよく観察すると明白な誤分類に相当するようなデータも含まれていることがあるが、その場合はオプションの解析パラメータの最適化すると改善する場合がある。
アンプリコンシーケンス解析結果を考察する上では、セカンドオピニオンとしてCrispRVariants [23]やMaChIAto [24]などの別の解析ツールを使ってデータを解析してみるのも参考になるだろう。特にMaChIAto [24]は約100 bp程度のタグ配列のMMEJノックイン [25]やPrime Editing [20]による小規模変異導入の分類定量に特化しており、さらに効率とゲノムコンテキストとの関連性を定量することも可能となっている。
CRISPResso2 [17]以外のウェブツールとしては、AGEseq [26]、Cas-Analyzer [27]、CLiCKAR [28]、Outknocker [29]、Hi-TOM [30]、BE-Analyzer [31]、CRISPR-sub [32]、PE-Analyzer [33]、CRISPR-Analytics [34]などもある。ただウェブツールベースでの解析は簡便ではあるものの、容量制限や時間効率、最適化に利用可能な解析パラメータの選択肢の面でデメリットが多いため、よりハイスループットかつ正確に解析したい場合はUNIX/LINUXのコマンドライン上で解析するツール(CLIツール)の利用を推奨したい。このカテゴリのCLIツールの多くは数十GB程度メモリを搭載するPCで動作するようにデザインされていることが多いため、個人利用レベルのPCで気軽に利用が可能である。CLIツールとしては、CLI 版CRISPResso2 [17]、CrispRVariants [23]、MaChIAto [24]、ampliCan [35]、CRIS.py [36]、CRISPRpic [37]、ampliconDIVider [38]、SIQ [39]等々、ウェブツールよりも数多くのツールが公開されている。
(3)ロングリードシーケンサーによるアンプリコンシーケンス解析ツール
ロングリードシーケンサーについては、それ自体がトップジャーナルで目にしないことはないほど近年目覚ましい成果をあげている [40–42]。2023年9月現在、主に取り上げられるロングリードシーケンサーのリードには、中央値にして50–150 kbの長さのリードを約95%の精度で出力できるOxford Nanopore Technologies (ONT)社のONTリード [40,43,44]と、Circular Consensus Sequencing (CCS) を利用して18–25 kbの長さのリードを99.9%以上の精度で出力できるPacBio社のHiFiリードがある [40,45]*1。ゲノム編集においてもONTリードやHiFiリードを活用してアンプリコンシーケンス解析を行うツールが報告されている。
ONTリードに対応した解析ツールとしては、DAJIN [46]、CRISPRnano [47]、CRISPR-Analytics [34]、VAULT [48]、GREPore-seq [49]がある。DAJIN [46]はアンプリコンサンプルを解析して、Large rearrangementも含めた遺伝型解析をすることができる。正確な変異判別のために深層学習をアルゴリズム内に実装しており、これは他のツールには見られない特徴といえる。
また、HiFiリードに対応したツールとしてはKnock-Knock [50]やSIQ [39]がある。また、先述したCRISPR-Analytics [34]やVAULT [48]もHiFiリードに対応している。これらはこの数年以内に登場した解析ツールであり、今後も新しいロングリード対応型解析ツールが登場することが予想される。
(4) Genome-wideオフターゲット解析ツール
オフターゲット解析にも様々なものがあるが、ゲノムを対象とした解析に限って大別するとすれば、オフターゲットが予想されるゲノム領域に着目して、項目(2)(3)のツールを適用する解析と、ゲノム全体を対象としてシーケンスでオフターゲット領域をスクリーニング的に検出する解析(本稿では『Genome-wideオフターゲット解析)と呼ぶ)がある。このカテゴリでは後者に関連したソフトウェアについて述べる。
まずクローニングされた細胞や個体のゲノムでGenome-wideオフターゲット解析を行う場合はBWA-MEM等のマッピングツールと変異検出ツールGenome Analysis ToolKit(GATK)等を組み合わせた標準的なWhole Genome Sequencing(WGS)解析を適用している例がいくつか報告されている [16,51–53]。
一方で、ポピュレーション(Bulk)サンプルのオフターゲットを評価する場合では、NGSシーケンスライブラリ調製と解析ツール(スクリプト)に独自の工夫を施して低コスト検出または高感度検出を狙ったアプリケーションが利用されることが多い。例えば、培養細胞内でゲノム編集したゲノムを調べる場合は、BLESS [54]、IDLV [55]、GUIDE-seq [56]、BLISS [57]、CasKAS [58]などのアプリケーションが存在している。一方で、試験管上でオフターゲットを推定するCell-freeアプローチとしてはDigenome-seq [59]、DIG-seq [60]、SITE-seq [61]、CIRCLE-seq [62]、CHANGE-seq [63]、Extru-seq [64]が報告されている。in vivoサンプルのオフターゲット解析法はDISCOVER-Seq [65]、GUIDE-tag [66]が報告されている。他にも、意図しないChromosomal rearrangementをスクリーニングする方法としては、LAM-HTGTS [67]、CAST-Seq [68]がある。さらにABEに特化した方法としてEndoV-seq [69]があり、Prime Editingに適用可能な手法としては、nDigenome-seq [70]、PEACSeq [71]、TAPE-seq [72]、CROss-seq [73]が報告されている。これらほとんどの手法ではショートリードNGSのためのライブラリ調製を行う必要がある。一方で、ロングリードであるONTリードやHiFiリード用のライブラリ調製を想定したものには、SMRT-OTS [74]、Nano-OTS [74]、InSiDeR [75]などがある。今後はロングリードを想定した手法も続々と登場していくものと考えられる。
またゲノムDNAを直接調べるのではなく、RNA-seqデータから得たトランスクリプトーム情報からゲノム上のDNAオフターゲットの痕跡を調べるアプローチとしてCRISPRroots [76]が報告されている。当然ながら、このアプローチでは発現遺伝子領域しか調べることができないが、簡易的なオフターゲット推定方法にはなりうる。さらに、このアプローチをより発展させて、トランスクリプトーム上に表出しているオフターゲットの痕跡からオフターゲットが表現型へ与えうる影響を遺伝子オントロジー(GO)レベルで推定するDANGER analysis [77]を当グループでは報告している。
なお本稿では取り上げなかったが、MAGeCK [79]、CERES [80]、PASTMUS [81]などのCRISPR screen解析ツールや、GESTALT [82]、FRACTAL [83]、BAR-Seq [84]などのTracing関連ツールも数多く存在している。さらに、解析に限定しない様々なゲノム編集関連ツールに関しては、過去に総論 [85]にて解説をまとめ、ウェブページ『Genome Editing Software Guide』(https://geditingsoftware.github.io)上にリストとして公開している(2023年9月現在、422点収録)。
本稿で紹介したゲノム編集サンプルの解析ソフトウェアの多くはヒトの培養細胞やマウスで評価されているものがかなり多く、それと比較すると他の生物種への適用例はまだ限定的である。その一方で、ゲノム編集研究メタデータベースGEM [78]よって機械的に収集された研究エントリーを参照すると、バクテリアやウイルスを除くCRISPR-Cas9関連研究の全35,937件のうち、ヒトやマウス以外の生物種811種のエントリーは9,528件(全体の約27%)となっている。もちろん総論的な内容の研究論文もこの中に含まれうるので厳密な数ではないが、他生物への応用が約十年間でかなり広がっているのは間違いないだろう。様々な生物種に対して、解析ソフトウェアがどのようにカバーしていくかも今後注目していきたい。
*1:両者の出力リードの長さや精度については、使用プロトコールや試薬、環境条件によって変動する可能性があるのであくまで一例としてご理解いただきたい。
1. Brinkman, E. K., Chen, T., Amendola, M. & van Steensel, B. Easy quantitative assessment of genome editing by sequence trace decomposition. Nucleic Acids Research 42, e168 (2014).
2. Conant, D. et al. Inference of CRISPR Edits from Sanger Trace Data. The CRISPR Journal 5, 123–130 (2022).
3. Bloh, K. et al. Deconvolution of Complex DNA Repair (DECODR): Establishing a Novel Deconvolution Algorithm for Comprehensive Analysis of CRISPR-Edited Sanger Sequencing Data. The CRISPR Journal 4, 120–131 (2021).
4. Brinkman, E. K. et al. Easy quantification of template-directed CRISPR/Cas9 editing. Nucleic Acids Research 46, e58 (2018).
5. Kluesner, M. G. et al. EditR: A Method to Quantify Base Editing from Sanger Sequencing. The CRISPR Journal 1, 239–250 (2018).
6. Happi Mbakam, C. et al. Prime editing optimized RTT permits the correction of the c.8713C>T mutation in DMD gene. Mol Ther Nucleic Acids 30, 272–285 (2022).
7. Wang, Q. et al. Broadening the reach and investigating the potential of prime editors through fully viral gene-deleted adenoviral vector delivery. Nucleic Acids Res 49, 11986–12001 (2021).
8. Erwood, S. et al. Saturation variant interpretation using CRISPR prime editing. Nat Biotechnol 40, 885–895 (2022).
9. Tremblay, G., Rousseau, J., Mbakam, C. H. & Tremblay, J. P. Insertion of the Icelandic Mutation (A673T) by Prime Editing: A Potential Preventive Treatment for Familial and Sporadic Alzheimer’s Disease. CRISPR J 5, 109–122 (2022).
10. Kawano, S., Ono, H., Takagi, T. & Bono, H. Tutorial videos of bioinformatics resources: online distribution trial in Japan named TogoTV. Brief Bioinform 13, 258–268 (2012).
11. Hill, J. T. et al. Poly Peak Parser: Method and software for identification of unknown indels using Sanger Sequencing of PCR products. Dev Dyn 243, 1632–1636 (2014).
12. Dehairs, J., Talebi, A., Cherifi, Y. & Swinnen, J. V. CRISP-ID: decoding CRISPR mediated indels by Sanger sequencing. Sci Rep 6, 28973 (2016).
13. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. Preprint at https://doi.org/10.48550/arXiv.1303.3997 (2013).
14. McKenna, A. et al. The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res. 20, 1297–1303 (2010).
15. Kaeuferle, T. et al. Genome-wide off-target analyses of CRISPR/Cas9-mediated T-cell receptor engineering in primary human T cells. Clinical & Translational Immunology 11, e1372 (2022).
16. Yang, L. et al. Targeted and genome-wide sequencing reveal single nucleotide variations impacting specificity of Cas9 in human stem cells. Nat Commun 5, 5507 (2014).
17. Clement, K. et al. CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nat Biotechnol 37, 224–226 (2019).
18. Nishida, K. et al. Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems. Science 353, aaf8729 (2016).
19. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420–424 (2016).
20. Anzalone, A. V. et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149–157 (2019).
21. Xu, X. et al. Engineered miniature CRISPR-Cas system for mammalian genome regulation and editing. Molecular Cell 81, 4333-4345.e4 (2021).
22. Willis, J. C. W., Silva-Pinheiro, P., Widdup, L., Minczuk, M. & Liu, D. R. Compact zinc finger base editors that edit mitochondrial or nuclear DNA in vitro and in vivo. Nat Commun 13, 7204 (2022).
23. Lindsay, H. et al. CrispRVariants charts the mutation spectrum of genome engineering experiments. Nat Biotechnol 34, 701–702 (2016).
24. Nakamae, K. et al. Detailed profiling with MaChIAto reveals various genomic and epigenomic features affecting the efficacy of knock-out, short homology-based knock-in and Prime Editing. 2022.06.27.496697 Preprint at https://doi.org/10.1101/2022.06.27.496697 (2022).
25. Nakade, S. et al. Microhomology-mediated end-joining-dependent integration of donor DNA in cells and animals using TALENs and CRISPR/Cas9. Nat Commun 5, 5560 (2014).
26. Xue, L.-J. & Tsai, C.-J. AGEseq: Analysis of Genome Editing by Sequencing. Mol Plant 8, 1428–1430 (2015).
27. Park, J., Lim, K., Kim, J.-S. & Bae, S. Cas-analyzer: an online tool for assessing genome editing results using NGS data. Bioinformatics 33, 286–288 (2017).
28. Iida, M. et al. A simple and practical workflow for genotyping of CRISPR–Cas9-based knockout phenotypes using multiplexed amplicon sequencing. Genes to Cells 25, 498–509 (2020).
29. Schmid-Burgk, J. L. et al. OutKnocker: a web tool for rapid and simple genotyping of designer nuclease edited cell lines. Genome Res 24, 1719–1723 (2014).
30. Liu, Q. et al. Hi-TOM: a platform for high-throughput tracking of mutations induced by CRISPR/Cas systems. Sci. China Life Sci. 62, 1–7 (2019).
31. Hwang, G.-H. et al. Web-based design and analysis tools for CRISPR base editing. BMC Bioinformatics 19, 542 (2018).
32. Hwang, G.-H. et al. CRISPR-sub: Analysis of DNA substitution mutations caused by CRISPR-Cas9 in human cells. Computational and Structural Biotechnology Journal 18, 1686–1694 (2020).
33. Hwang, G.-H. et al. PE-Designer and PE-Analyzer: web-based design and analysis tools for CRISPR prime editing. Nucleic Acids Res 49, W499–W504 (2021).
34. Sanvicente-García, M. et al. CRISPR-Analytics (CRISPR-A): A platform for precise analytics and simulations for gene editing. PLOS Computational Biology 19, e1011137 (2023).
35. Labun, K. et al. Accurate analysis of genuine CRISPR editing events with ampliCan. Genome Res 29, 843–847 (2019).
36. Connelly, J. P. & Pruett-Miller, S. M. CRIS.py: A Versatile and High-throughput Analysis Program for CRISPR-based Genome Editing. Sci Rep 9, 4194 (2019).
37. Lee, H., Chang, H. Y., Cho, S. W. & Ji, H. P. CRISPRpic: fast and precise analysis for CRISPR-induced mutations via prefixed index counting. NAR Genomics and Bioinformatics 2, (2020).
38. Varshney, G. K. et al. High-throughput gene targeting and phenotyping in zebrafish using CRISPR/Cas9. Genome Res. 25, 1030–1042 (2015).
39. van Schendel, R., Schimmel, J. & Tijsterman, M. SIQ: easy quantitative measurement of mutation profiles in sequencing data. NAR Genom Bioinform 4, lqac063 (2022).
40. Rautiainen, M. et al. Telomere-to-telomere assembly of diploid chromosomes with Verkko. Nat Biotechnol 1–9 (2023) doi:10.1038/s41587-023-01662-6.
41. Nurk, S. et al. The complete sequence of a human genome. Science 376, 44–53 (2022).
42. Prjibelski, A. D. et al. Accurate isoform discovery with IsoQuant using long reads. Nat Biotechnol 41, 915–918 (2023).
43. Jain, M. et al. Nanopore sequencing and assembly of a human genome with ultra-long reads. Nat Biotechnol 36, 338–345 (2018).
44. Shafin, K. et al. Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes. Nat Biotechnol 38, 1044–1053 (2020).
45. Wenger, A. M. et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nat Biotechnol 37, 1155–1162 (2019).
46. Kuno, A. et al. DAJIN enables multiplex genotyping to simultaneously validate intended and unintended target genome editing outcomes. PLOS Biology 20, e3001507 (2022).
47. Nguyen, T., Ramachandran, H., Martins, S., Krutmann, J. & Rossi, A. Identification of genome edited cells using CRISPRnano. Nucleic Acids Res 50, W199–W203 (2022).
48. Bi, C. et al. Long-read individual-molecule sequencing reveals CRISPR-induced genetic heterogeneity in human ESCs. Genome Biology 21, 213 (2020).
49. Quan, Z.-J. et al. GREPore-seq: A robust workflow to detect changes after gene editing through long-range PCR and nanopore sequencing. Genomics, Proteomics & Bioinformatics (2022) doi:10.1016/j.gpb.2022.06.002.
50. Canaj, H. et al. Deep profiling reveals substantial heterogeneity of integration outcomes in CRISPR knock-in experiment. Preprint at https://doi.org/10.1101/841098 (2019).
51. Veres, A. et al. Low incidence of off-target mutations in individual CRISPR-Cas9 and TALEN targeted human stem cell clones detected by whole-genome sequencing. Cell Stem Cell 15, 27–30 (2014).
52. Wang, X. et al. Low incidence of SNVs and indels in trio genomes of Cas9-mediated multiplex edited sheep. BMC Genomics 19, 397 (2018).
53. Luo, X. et al. Trio deep-sequencing does not reveal unexpected off-target and on-target mutations in Cas9-edited rhesus monkeys. Nat Commun 10, 5525 (2019).
54. Crosetto, N. et al. Nucleotide-resolution DNA double-strand breaks mapping by next-generation sequencing. Nat Methods 10, 361–365 (2013).
55. Wang, X. et al. Unbiased detection of off-target cleavage by CRISPR-Cas9 and TALENs using integrase-defective lentiviral vectors. Nat Biotechnol 33, 175–178 (2015).
56. Tsai, S. Q. et al. GUIDE-Seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187–197 (2015).
57. Yan, W. X. et al. BLISS is a versatile and quantitative method for genome-wide profiling of DNA double-strand breaks. Nat Commun 8, 15058 (2017).
58. Marinov, G. K. et al. CasKAS: direct profiling of genome-wide dCas9 and Cas9 specificity using ssDNA mapping. Genome Biol 24, 85 (2023).
59. Kim, D., Kang, B.-C. & Kim, J.-S. Identifying genome-wide off-target sites of CRISPR RNA-guided nucleases and deaminases with Digenome-seq. Nat Protoc 16, 1170–1192 (2021).
60. Kim, D. & Kim, J.-S. DIG-seq: a genome-wide CRISPR off-target profiling method using chromatin DNA. Genome Res 28, 1894–1900 (2018).
61. Cameron, P. et al. Mapping the genomic landscape of CRISPR-Cas9 cleavage. Nat Methods 14, 600–606 (2017).
62. Tsai, S. Q. et al. CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets. Nat Methods 14, 607–614 (2017).
63. Lazzarotto, C. R. et al. CHANGE-seq reveals genetic and epigenetic effects on CRISPR–Cas9 genome-wide activity. Nat Biotechnol 38, 1317–1327 (2020).
64. Kwon, J. et al. Extru-seq: a method for predicting genome-wide Cas9 off-target sites with advantages of both cell-based and in vitro approaches. Genome Biol 24, 4 (2023).
65. Wienert, B. et al. Unbiased detection of CRISPR off-targets in vivo using DISCOVER-Seq. Science 364, 286–289 (2019).
66. Liang, S.-Q. et al. Genome-wide detection of CRISPR editing in vivo using GUIDE-tag. Nat Commun 13, 437 (2022).
67. Hu, J. et al. Detecting DNA Double-Stranded Breaks in Mammalian Genomes by Linear Amplification-mediated High-Throughput Genome-wide Translocation Sequencing (LAM-HTGTS). Nat Protoc 11, 853–871 (2016).
68. Turchiano, G. et al. Quantitative evaluation of chromosomal rearrangements in gene-edited human stem cells by CAST-Seq. Cell Stem Cell 28, 1136-1147.e5 (2021).
69. Liang, P. et al. Genome-wide profiling of adenine base editor specificity by EndoV-seq. Nat Commun 10, 67 (2019).
70. Kim, D. Y., Moon, S. B., Ko, J.-H., Kim, Y.-S. & Kim, D. Unbiased investigation of specificities of prime editing systems in human cells. Nucleic Acids Res 48, 10576–10589 (2020).
71. Yu, Z. et al. PEAC-seq adopts Prime Editor to detect CRISPR off-target and DNA translocation. Nat Commun 13, 7545 (2022).
72. Kwon, J. et al. TAPE-seq is a cell-based method for predicting genome-wide off-target effects of prime editor. Nat Commun 13, 7975 (2022).
73. Li, Y. et al. Systematic identification of CRISPR off-target effects by CROss-seq. Protein Cell 14, 299–303 (2022).
74. Höijer, I. et al. Amplification-free long-read sequencing reveals unforeseen CRISPR-Cas9 off-target activity. Genome Biology 21, 290 (2020).
75. Höijer, I. et al. CRISPR-Cas9 induces large structural variants at on-target and off-target sites in vivo that segregate across generations. Nat Commun 13, 627 (2022).
76. Corsi, G. I., Gadekar, V. P., Gorodkin, J. & Seemann, S. E. CRISPRroots: on- and off-target assessment of RNA-seq data in CRISPR–Cas9 edited cells. Nucleic Acids Res 50, e20 (2021).
77. Nakamae, K. & Bono, H. DANGER analysis: risk-averse on/off-target assessment for CRISPR editing without a reference genome. Bioinform Adv 3, vbad114 (2023).
78. Suzuki, T. & Bono, H. GEM: Genome Editing Meta-database, a dataset of genome editing related metadata systematically extracted from PubMed literatures. Gene and Genome Editing 5, 100024 (2023).
79. Li, W. et al. MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens. Genome Biology 15, 554 (2014).
80. Meyers, R. M. et al. Computational correction of copy-number effect improves specificity of CRISPR-Cas9 essentiality screens in cancer cells. Nat Genet 49, 1779–1784 (2017).
81. Zhang, X. et al. PASTMUS: mapping functional elements at single amino acid resolution in human cells. Genome Biology 20, 279 (2019).
82. McKenna, A. et al. Whole-organism lineage tracing by combinatorial and cumulative genome editing. Science 353, aaf7907 (2016).
83. Konno, N. et al. Deep distributed computing to reconstruct extremely large lineage trees. Nat Biotechnol 40, 566–575 (2022).
84. Ferrari, S. et al. BAR-Seq clonal tracking of gene-edited cells. Nat Protoc 16, 2991–3025 (2021).
85. Nakamae, K. & Bono, H. Genome editing and bioinformatics. Gene and Genome Editing 3–4, 100018 (2022).