Tuyen Tran, MD
Lập trình & Phân tích

SPSS hay R cho bác sĩ lâm sàng: chọn cái nào?

Mình đã dùng SPSS 5 năm trước khi đổi sang R. 80% bài báo của bác sĩ lâm sàng không cần phải đổi. Đây là khi nên và khi không nên.

Câu hỏi SPSS vs R xuất hiện đều đặn mỗi khi mình ngồi với một đồng nghiệp trẻ vừa publish bài báo đầu tiên. Họ đã làm xong descriptive trên SPSS, viết Methods khá ổn, rồi nghe ai đó nói R "chuyên nghiệp hơn". Câu hỏi luôn là: có nên đổi không.

Mình đã dùng SPSS 5 năm trước khi chuyển sang R hai năm gần đây. Hầu hết thời gian, câu trả lời cho câu hỏi đó là không. Bài này giải thích lý do và chỉ ra ngoại lệ.

SPSS làm được gì cho 80% paper lâm sàng

Nhìn vào danh sách phân tích trong các bài báo lâm sàng phổ biến: descriptive (mean, median, proportion), so sánh hai nhóm (t-test, Mann-Whitney, chi-square), regression đơn giản (linear, logistic), survival analysis cơ bản (Kaplan-Meier, Cox). SPSS làm được tất cả với click chuột. Output có sẵn p-value, CI, không cần code thêm.

Ba paper đầu tay của mình ở Vinmec, gồm một retrospective cohort 80 ca, một case-control 60 cặp, và một descriptive analysis registry, đều chạy bằng SPSS hết. Reviewer chưa bao giờ chê về phần mềm. Họ hỏi về sample size, về định nghĩa outcome, về missing data. Không ai hỏi tại sao dùng SPSS thay vì R.

Bác sĩ lâm sàng có 15-20 giờ một tuần cho nghiên cứu. Bỏ 30-40 giờ đi học R chỉ để chạy lại t-test mà SPSS đã chạy được trong 30 giây không phải đầu tư khôn ngoan.

Hai năm R giúp mình làm thêm được gì

Mình chuyển sang R khi bắt đầu cohort ARM (atypical retroperitoneal masses) ở Nhi Đồng 2. Hơn 100 ca, 5 năm dữ liệu, ba paper trong pipeline. Lúc đó SPSS bắt đầu đuối ở ba điểm.

Thứ nhất, automation. Mình muốn re-run toàn bộ phân tích sau khi anh PI thêm 12 ca mới. SPSS phải click lại từ đầu. R có script, chạy lại 1 lệnh. Nếu bạn đụng dữ liệu update thường xuyên, đặc biệt cohort prospective, R tiết kiệm hàng giờ.

Thứ hai, figure custom. Reviewer Q1 thường yêu cầu figure đẹp, nhãn đầy đủ, panel multi. SPSS chart tốn nhiều thao tác để tinh chỉnh. ggplot trong R cho phép kiểm soát từng pixel với 5-10 dòng. Forest plot cho paper phân tích gộp của mình làm trong 3 phút bằng metafor.

Thứ ba, meta-analysis. SPSS có module meta nhưng yếu. Nếu bạn định viết một bài SR/MA, R metafor hoặc Stata là chuẩn. Đây là lý do duy nhất mình bắt buộc phải học R cho paper phân tích gộp đó.

Khi nào SPSS đủ, khi nào nên đổi

SPSS đủ nếu bạn:

  • Làm 1-3 paper retrospective hoặc case-control mỗi năm
  • Phân tích descriptive cộng comparison đơn giản cộng regression cơ bản
  • Không update dữ liệu nhiều lần
  • Không định viết SR/MA

Nên đổi sang R nếu bạn:

  • Có cohort prospective với data update hằng tuần hoặc hằng tháng
  • Cần workflow reproducible cho group nhiều người (cohort registry, multi-center)
  • Bắt đầu viết meta-analysis
  • Muốn gen figure publication-ready không qua tay đồ hoạ

Câu trả lời thật

Đa số bác sĩ lâm sàng VN nên ở lại SPSS thêm 2-3 năm. Tập trung vào câu hỏi nghiên cứu, vào IRB, vào Discussion. Đừng để việc chuyển công cụ chiếm slot thời gian quý hơn.

Khi nào bạn thấy mình mở SPSS làm cùng 1 thao tác hơn 5 lần một tuần, đó là tín hiệu đáng nghĩ đến R. Không sớm hơn.

Nếu đã quyết học R, mình có viết một lộ trình 8 tuần dành cho bác sĩ chưa biết code. Vào thẳng đó, không vòng vo qua tutorial generic của Tidyverse.


Học R cho mục tiêu publish, không phải cho hứng thú công cụ. Khoá R-stats cho bác sĩ đi từ con số 0 đến chạy regression cho paper trong 8 tuần, thiết kế cho người chỉ có 30 phút mỗi ngày giữa ca trực.