こんにちは。株式会社kikitoriでエンジニアをしている岩本です。
弊社では、AIを活用した業務改善に全社で取り組んでいます。 その一環として、開発時のコードレビューにAIを活用する試みで得られた知見をご紹介します。
AI自動コードレビューツールの選定
ツールの選定にあたり、以下の3つの観点を重視しました。
* ドメイン知識やビジネスロジックを考慮したレビューが可能か
私たちが開発するJA・市場向けの業務SaaS「nimaru」は、専門的な業務知識や複雑なドメインを扱います。そのため、単なる構文チェックに留まらず、プロダクト固有のドメイン知識やビジネスロジックを反映したレビューができることが、ツールを導入する上での重要な要件です。
具体的には、Jiraチケットに記載された仕様をAIが理解し、実装の妥当性や考慮漏れを指摘できるかを重視しました。
* チームの開発フローに馴染むか
チームの一員として自然に受け入れられ、開発フローを妨げない使いやすさも重要な観点です。
* コストは妥当か
機能に見合った価格で、費用を抑えられることが望ましいです。
選定候補ツール
上記の観点とJira連携などを考慮し、以下4ツールを候補としました。
Qodo Merge
オープンソースのPRレビューツール「pr-agent」を企業向けに拡張したサービス。
TOML形式の設定ファイルで細かくカスタマイズでき、RAG技術によるコードベース全体の分析も可能です。
価格: 開発者1人あたり月額38ドル
Code Rabbit
対話形式でコードレビューを進められるツールです。専用UIまたは設定ファイルでレビュー内容を柔軟に調整できます。
価格: 開発者1人あたり月額30ドル
Greptile
コードベース全体を読み込み、レビューを行います。
特徴的なのは、レビュアー(人間)のコメントも学習し、使えば使うほどプロジェクトに最適化されていく点です。
Jiraだけでなく、NotionやGoogle Driveのドキュメントを知識ソースとして読み込める点も魅力です。
価格: 開発者1人あたり月額30ドル
Claude (Anthropic)
AI レビュー専用ツールではありませんが、社内でコーディング支援AIとして利用実績のあるLLM「Claude」でGitHub Actionを使いコードレビューにも活用でき既に導入済みいうことで、比較対象としました。
価格: API利用量に応じた従量課金制
導入と比較評価
比較方法
実際の開発案件を題材に、各ツールを試しました。
題材: 特定の項目をCSVダウンロードする機能の開発
準備1: Jiraに受け入れ条件を詳細に記載
Code Rabbitに明確なチケットの記載例が載っていたのでそれを参考に設定
準備2: 受け入れ条件を意図的に満たさないコミットを一部作成し、AIがそれを指摘できるか検証
評価結果
Qodo Merge
良い点
- TOMLファイルによる設定の自由度が高く、他のツールより詳細なカスタマイズが可能です。
- Jira連携の精度が高く、チケットの内容を深く理解した上でのレビューが見られました。
気になる点
- 他のツールに比べてレビューの指摘事項数が少ない印象です。





Code Rabbit
良い点
- 他のツールに比べて導入が簡単で、yamlの設定項目もドキュメント見て設定しやすいです。
- 処理の流れをシーケンス図で自動生成してくれるため、視覚的な理解がしやすいです。
気になる点
- Jiraチケットの仕様を反映した指摘が少なく、コードの細かな文法チェックが中心でした。



Greptile
良い点
- 条件に合致するスタートアップは割引があります。
気になる点
レビューのカスタマイズには試行錯誤が必要で、設定項目の参考例が少なかったです。
初期設定からサービスが利用可能になるまでに少し時間がかかりました。





Claude
良い点
指摘の的確さと分かりやすさは、今回試した中で最も優れていました。
正式なJira連携機能はないものの、PRのdescriptionに仕様を書き出すという簡単な工夫で、仕様の考慮漏れなどを的確に指摘できました。
(画像:指摘の例、レビュー総評)



チーム内での評価
各ツールのレビュー結果をチーム内で比較したところ、「端的かつ仕様の要点を網羅している」として、Claudeのレビューが最も高く評価されました。
まとめ
今回の比較検証を経て、現在の私たちのチームに最もフィットするのはClaudeであるという結論に至りました。
その理由は、指摘の質の高さと、簡単な工夫でドメイン知識を反映させられた柔軟性にあります。重視した「ドメイン知識を考慮したレビュー」という観点では、ツールごとにアプローチが異なり、今回の検証ではClaudeとQodo Mergeが特に有効でした。
コスト面でも、Claudeの従量課金制は、私たちのチーム状況によって月額固定料金のツールより費用を抑えられる可能性があります。
現状、複雑なロジックの妥当性評価はまだ人間に分がありますが、仕様の考慮漏れを指摘するアシスタントとしては、AIはすでに非常に有用です。
そしてツールを比較する中で、今後AIレビューの質をさらに高めるには、プロジェクトに合わせて「AIを育てていく」という視点が重要だと改めて感じました。
株式会社kikitoriでは、今回の取り組みを足がかりに、今後もAIを活用した業務改善と開発効率の向上に積極的に取り組んでいきます。
(※本記事は2025年7月時点の情報に基づいています。各ツールの最新の価格や機能については、公式サイトをご確認ください。)