Tuyen Tran, MD
AI cho nghiên cứu

Claude vs ChatGPT cho bác sĩ — mình test trên paper của mình

5 task cụ thể: literature search, draft Discussion, methodology critique, table extraction, response letter. Claude thắng ở reasoning, ChatGPT thắng ở speed.

Claude tốt hơn ChatGPT cho nghiên cứu — câu trả lời ngắn này đúng nhưng quá rộng. Sau 1 năm dùng cả 2 cho loạt paper chẩn đoán hình ảnh dị tật hậu môn trực tràng ở trẻ sơ sinh (1 đã đăng Journal of Pediatric Surgery 2026, 1 đang review tại Pediatric Surgery International, 1 đang chuẩn bị), mình thấy mỗi tool thắng ở task khác nhau. Bài này test cùng 5 task trên cả 2 tool, output cụ thể.

Caveat: mình dùng Claude Sonnet 4.5 + Claude Max plan, ChatGPT GPT-4o + Plus plan. Free tier kết quả khác.

Task 1: Literature search short-list

Prompt: "Tôi cần short-list 10 paper về TPUS diagnostic accuracy in anorectal malformation 2020-2026. Yêu cầu: peer-reviewed, sample n≥30, có sensitivity/specificity report."

Claude: trả về 10 paper với title, journal, year, DOI, 1 dòng tóm tắt mỗi paper. 8/10 verified trên PubMed (mình check sau). 2 paper hallucinated — author kết hợp năm sai.

ChatGPT: trả về 12 paper, structured table. 6/12 verified, 6/12 hallucinated. Tệ hơn Claude.

Winner: Claude — nhưng vẫn phải verify mỗi citation qua ResearchCheck. AI suggest reference đều có rủi ro hallucinate.

Task 2: Draft Discussion (đoạn 300 từ)

Prompt: "Đây là kết quả paper TPUS của mình: TPUS sensitivity 89%, specificity 92%, n=80. So sánh với 3 paper short-list, viết đoạn Discussion 300 từ."

Claude: 320 từ. Structure: agreement với Niedzielski 2024, disagreement với Long 2024 (explain bằng population difference: high vs low ARM ratio). Mention limitation single-center. Reasoning chain rõ ràng.

ChatGPT: 280 từ. Liệt kê 3 paper với "consistent with prior studies" generic. Không explain disagreement. Methodology limitation generic.

Winner: Claude — Claude bám claim cụ thể, ChatGPT viết hay nhưng nông.

Task 3: Methodology critique

Prompt: "Reviewer khắt khe sẽ challenge methodology paper này điểm nào? Liệt kê 5 điểm cụ thể."

Claude: 5 điểm chi tiết — selection bias (single center bias), index test interpretation blind hay không, reference standard timing gap, MRI sub-cohort size 22 chưa đủ power cho subgroup, statistical inflation từ multiple comparison.

ChatGPT: 5 điểm generic — sample size, generalizability, blinding, follow-up duration, conflict of interest. Đa số không dính methodology paper.

Winner: Claude rõ ràng — Claude đọc context paper, ChatGPT trả lời theo template chung.

Task 4: Extract data table từ paper khác

Prompt: Upload PDF Niedzielski 2024 (paper 14 trang), prompt "Extract Table 2 (diagnostic accuracy by ARM type) thành CSV format".

Claude: Extract đúng structure 5 row × 4 column, value chính xác 100% so với paper.

ChatGPT: Extract 4 row (miss 1 row), 1 value sai (89% thay vì 87%).

Winner: Claude — extraction precision quan trọng cho meta-analysis. Paper meta-analysis của mình extract 200 paper × 6 fields = 1200 data points, 1% error rate = 12 sai số. Không chấp nhận được.

Task 5: Response letter to reviewer

Prompt: "Reviewer 4 said TPUS validation chưa convincing vì single-center. Viết response letter politely mà confident, 200 từ."

Claude: Tone formal-academic, structure: ack concern → counter argument 1 (multi-operator validation trong center), counter 2 (phân bố thể bệnh trong cohort khớp với dịch tễ VN), commitment to multi-center prospective. 195 từ.

ChatGPT: Tone slightly defensive, structure tương tự nhưng dùng cụm "We respectfully submit" hơi formal-cliché. 180 từ.

Tie. Mình thường merge 2 output, lấy structure Claude + 1-2 phrase ChatGPT.

Tổng kết — chọn nào cho task nào

Task Winner Lý do
Literature search Claude Hallucinate ít hơn
Draft Discussion Claude Reasoning bám claim
Methodology critique Claude Đọc context paper
Data extraction từ PDF Claude Precision cao
Response letter Tie Cả 2 OK với edit
Image/table parsing ChatGPT Vision tốt hơn (chưa test trong batch này)
Speed (≤30s response) ChatGPT Nhanh hơn ~2x

Mình dùng Claude làm primary cho 90% task nghiên cứu. ChatGPT khi cần image OCR (table chụp từ paper cũ) hoặc speed (≤30 giây response cho task đơn giản).

Workflow tổng

5 task này nằm trong workflow AI 5 step cho nghiên cứu của mình. Pillar: Workflow AI cho bác sĩ làm nghiên cứu — từ đọc paper đến viết Discussion.

5 prompt structured cho draft Discussion (mình paste 4-5 lần/tuần): 5 prompt Claude mình dùng hằng ngày khi đọc paper.

Khoá AI nghiên cứu

Module 2 khoá AI cho nghiên cứu trên tuyentranmd.com cover deep so sánh Claude/ChatGPT/Gemini/local model cho 12 task nghiên cứu cụ thể. Plus prompt template + decision tree pick tool theo task.