Monthly Archives: December 2010

Phân tích kỹ thuật các kiểu gõ tiếng Việt

Bài đã đăng tạp chí PCWorld Vietnam, January 8, 2009. See .

Xử lý tiếng Việt là vấn đề rất cũ, nhưng không phải là nhỏ vì ảnh hưởng tới rất nhiều người dùng. Đa phần các bộ gõ tiếng Việt lâu nay là tự phát, không có tài liệu phân tích kỹ thuật chi tiết. Nhân hợp tác với nhóm m17n thuộc AIST (Viện Khoa Học và Công Nghệ Công Nghiệp Tiên Tiến Nhật Bản) để cải tiến và phát triển các bộ gõ tiếng Việt, Chăm, Thái… trên môi trường Linux mã mở, chúng tôi đã thực hiện một số tài liệu phân tích kỹ thuật một cách bài bản, sau đây xin giới thiệu một số vấn đề rút từ những tài liệu đó.

I. Vài số liệu thống kê về hệ thống âm-vần-chữ cái tiếng Việt

Đây không phải là các thống kê ngôn ngữ học mà chỉ tập trung vào các dữ liệu liên quan tới việc xây dựng bộ bàn phím tiếng Việt.

1. Tổng số đơn âm tiếng Việt theo thống kê chưa đầy đủ của chúng tôi là: 7432.

Số này cũng xấp xỉ số liệu của GS Hoàng Phê, chủ biên từ điển Chính Tả Tiếng Việt. Số tuyệt đối không quan trọng vì dưới đây chỉ để ý tỉ lệ so sánh tương đối.

2. Số âm có dấu thanh: 6050, tỉ lệ: 81,4%

3. Số đơn âm viết có ít nhất một dấu thanh hoặc dấu phụ: 6761, tỉ lệ: 91%

4. Thanh sắc: 1861, tỉ lệ: 25%

5. Thanh nặng: 1474, tỉ lệ: 19,8%

6. Không dấu: 1382, tỉ lệ: 18,6%

7. Thanh huyền: 1177, tỉ lệ: 15,8%

8. Thanh hỏi: 980, tỉ lệ: 13,2%

9. Thanh ngã: 558, tỉ lệ: 7,5%

10. Số âm có phụ âm đầu: 7110, tỉ lệ: 95,7%

11. Số âm không phụ âm đầu: 322, tỉ lệ: 4,3%

12. Số dạng tổ hợp nguyên âm (không tính phụ âm cuối): 64

a. Số nguyên âm đơn: 12 (a, e, o, i, u, y, â, ê, ô, ơ, ă, ư)

b. Tổ hợp kép 2 nguyên âm: 32

c. Tổ hợp kép 3 nguyên âm: 20

13. Số vần (tổ hợp nguyên âm + phụ âm cuối): 228

14. Có 8 phụ âm cuối: M, N, C, T, P, CH, NG, NH

15. Và có 8 phụ âm đầu kép: CH, KH, NG, NGH, NH, TR, TH, PH.

II. Tần suất sử dụng phím

Chúng tôi thực hiện thống kê trên một văn bản thuần Việt và đủ lớn là Truyện Kiều, vì Truyện Kiều là một thể hiện điển hình của tiếng Việt. Chúng tôi đã chọn bản Nôm Liễu Văn Đường (1871), gồm 3244 câu, 22708 chữ.

Bảng 1: Dùng kiểu gõ Telex

Trung bình: 4,68 lần gõ phím trên 1 chữ

Phím dùng Số lần gõ Tỉ lệ %
A 12411 11,69
N 10327 9,727
O 9427 8,879
H 6347 5,978
F 6205 5,844
W 6087 5,733
I 5774 5,438
G 5384 5,071
E 5161 4,861
T 5029 4,737
S 4844 4,563
D 4531 4,268
U 4271 4,023
C 3555 3,348
R 2978 2,805
M 2573 2,423
J 2525 2,378
X 1748 1,646
Y 1685 1,587
L 1606 1,513
B 1065 1,003
V 907 0,854
K 719 0,677
P 700 0.659
Q 310 0,292
Tính theo hàng
home row 44572 41,982
qwer row 41422 39,015
zxcv row 20175 19,003
num row 0 0
Tổng số lượt gõ 106169

Bảng 2: Dùng kiểu gõ VNI

Trung bình: 4,72 lần gõ phím trên 1 chữ

Phím dùng Số lần gõ Tỉ lệ %
N 10327 9,621
A 10141 9,448
O 7523 7,009
6 6384 5,948
H 6347 5,913
2 6205 5,781
I 5774 5,379
U 5438 5,066
G 5384 5,016
T 5029 4,685
7 4938 4,601
1 4006 3,732
C 3555 3,312
E 2951 2,749
D 2653 2,472
M 2573 2,397
5 2525 2,352
9 1878 1,75
Y 1685 1,57
L 1606 1,496
R 1602 1,493
3 1376 1,282
4 1252 1,166
8 1149 1,07
B 1065 0,992
V 907 0,845
S 838 0,781
K 719 0,67
0,67 700 0,652
X 496 0,462
Q 310 0,289
Tính theo hàng
home row 27688 25,796
qwer row 29327 27,323
zxcv row 20608 19,201
num row 29713 27,682
Tổng số lượt gõ 107336

Bảng 3: Tần suất sử dụng các vần

(chỉ kê ra 32 vần thông dụng nhất)

Vần Số lần Tỉ lệ %
a 140 1 6,153
ai 781 3,430
ơi 697 3,061
ang 679 2,982
ay 654 2,872
i 644 2,828
ên 603 2,648
ao 581 2,552
ong 568 2,495
ây 566 2,486
o 561 2,464
inh 544 2,389
ương 510 2,240
ôi 509 2,235
ăng 491 2,156
ơ 473 2,077
ưa 443 1,946
âu 439 1,928
ông 436 1,915
ê 408 1,792
ung 386 1,695
ư 385 1,691
anh 384 1,686
ôt 346 1,520
ươi 330 1,449
ên 308 1,353
on 295 1,296
iêu 294 1,291
e 274 1,203
an 271 1,190
ươc 267 1,173
âm 245 1,076
u 230 1,010

Nhận xét chung

– Nhìn chung nếu chia bình quân thì tần suất sử dụng các phím dấu thanh gần bằng các phím nguyên âm và lớn hơn tần suất dùng các phím phụ âm. Đây là một chi tiết rất quan trọng mà chúng ta sẽ cần dùng trong phần so sánh các kiểu gõ Telex, VNI dưới đây.

– Nhưng xét trị tuyệt đối thì phụ âm n và hai phím nguyên âm a, o đứng đầu bảng tức là dùng nhiều nhất, trong cả 2 kiểu gõ.

III. Các luật gõ tiếng Việt

Mô hình cấu trúc một từ tiếng Việt, dấu ngoặc tròn là thành phần luôn phải có, ngoặc vuông có thể có hoặc không:

[C] ((V1) [V2] [V3] [T]) [C]

C: phụ âm đầu

V1: nguyên âm 1, luôn có ít nhất một nguyên âm

V2: nguyên âm 2

V3: nguyên âm 3

T: dấu thanh

C: phụ âm cuối

Các luật gõ chính thức của các kiểu gõ Telex, VNI, TCVN 6064 chỉ là một bảng các quy tắc ánh xạ phím, khá quen thuộc nên chúng tôi xin lược bỏ để giới thiệu sang quy luật về vị trí dấu thanh, thiết thực hơn. Quy luật vị trí dấu thanh trên các tổ hợp nguyên âm, theo GS Hoàng Phê, như sau:

1. Khi chỉ có 1 nguyên âm thì dấu đặt trên nguyên âm đó

2. Khi có phụ âm cuối thì dấu nằm ở nguyên âm sát phụ âm cuối

3. Vần có nguyên âm đệm oa, oe, uê, uơ, uy thì dấu nằm ở nguyên âm chính (sau)

4. Các vần tận cùng là nguyên âm (có thể 2 hay 3 nguyên âm) và khác oa, oe, uê, uơ, uy thì dấu nằm trên nguyên âm đứng trước nguyên âm tận cùng.

Tuy nhiên qua thực tiễn ở VN thì các vần bất định oa, oe, uy phần nhiều vẫn theo kiểu bỏ dấu cũ, dấu thanh đặt trên nguyên âm đệm. Vì vậy các bộ gõ đều cung cấp khóa chuyển cho phép chọn kiểu bỏ dấu mới hay cũ cho chúng – bộ gõ m17n cũng thế.

IV. Phân tích ưu điểm của kiểu gõ Telex so với VNI, TCVN

Nhiều người khẳng định kiểu gõ Telex là tiện lợi nhất khi gõ thuần tiếng Việt, nhưng thuận lợi ở điểm nào thì lại không nói, ở đây chúng tôi thử phân tích:

1. Kiểu gõ Telex hoàn toàn chỉ sử dụng 3 hàng phím tiếng Anh cơ bản (QWER … ASDF … ZXCV..). Trong đó hàng phím ASDF… tiếng Anh là “home row” chính là hàng phím cơ sở, trong kiểu gõ 10 ngón tay thì hai ngón trỏ được định vị trên hai phím F&J trên hàng phím này (hai phím này có gờ nhỏ để đánh dấu), các ngón khác xếp tự nhiên ở các phím bên cạnh trên home row. Khi gõ 10 ngón tay, dễ dàng nhận thấy là ngón tay càng phải dời xa hàng phím cơ sở thì càng khó gõ đồng thời càng dễ gõ sai hơn. Kiểu gõ Telex có lợi thế hơn VNI và TCVN chính ở điểm này, do không dùng đến hàng phím số ở xa home row.

2. Trong kiểu gõ Telex, hàng phím cơ sở dễ gõ nhất đồng thời lại là hàng phím có tần suất sử dụng lớn nhất, tần suất của hai hàng còn lại cũng khá cân đối (xem bảng thống kê ở phần II).

3. Khi dùng kiểu gõ VNI tất cả các dấu phụ đều bị đẩy lên hàng phím số, phần lớn dấu phụ của kiểu gõ TCVN cũng thế, cho nên hàng phím khó gõ nhất này lại có tần suất sử dụng lớn nhất (xem bảng thống kê tần suất ở trên, hoặc có thể đoán qua con số 91% các từ tiếng Việt có dấu phụ).

4. Kiểu gõ VNI & TCVN bỏ phí không dùng đến 4 phím w,f,j,z ở khu vực dễ gõ. Trong khi Telex nguyên thủy chỉ bỏ phí một phím z thôi. Chú ý thêm là hai phím định vị quan trọng F&J trong kiểu gõ Telex được dùng với tần suất khá lớn thì VNI/TCVN lại bỏ phí.

5. Cơ chế gõ lặp phím để tạo dấu cho đ-â-ô-ê (các cải tiến hiện nay còn cho phép hủy dấu, mở rộng sang cả dấu thanh) của kiểu gõ Telex là rất tiết kiệm. Tuy cũng phải gõ 2 lượt phím như VNI nhưng thực chất ngón tay chỉ di chuyển lên xuống thêm chừng 5mm, đồng thời rất khó gõ sai. Chính các điện thoại di động cũng dùng cơ chế gõ lặp phím để sinh ra nhiều chữ, nên cơ chế này tạo cảm giác khá thân thuộc cho người dùng.

V. Phân tích nhược điểm của kiểu gõ Telex so với VNI, TCVN và định hướng giải quyết

Cho đến nay chúng tôi chỉ xác định được một nhược điểm của kiểu gõ Telex so với VNI và TCVN là khó gõ hỗn hợp Anh-Việt. Tiếc thay, đây lại là một nhược điểm chí mạng trong điều kiện giao lưu quốc tế rộng rãi ngày nay, nhất là với những người làm chuyên về KHKT, CNTT…

Tuy các phần mềm đều có phím nóng để chuyển qua lại giữa trạng thái gõ Anh và Việt, nhưng nhiều người lại không thích dùng mà muốn các bộ gõ tự động xử lý vấn đề này.

Để xử lý được việc gõ hỗn hợp thì trước hết bộ gõ phải được cung cấp các tiêu chí phân biệt từ Anh/Việt để quyết định xử lý từ đang đánh như tiếng Việt hay tiếng Anh, đây chính là chỗ mà mục này sẽ phân tích.

Giải quyết trọn vẹn nhất là gắn vào bộ gõ một modul kiểm tra chính tả và một từ điển chính tả tiếng Việt, tuy không khó nhưng cũng khá phiền phức. Nếu không thì phải tìm kiếm một số tiêu chí để chuyển tự động về tiếng Anh dựa trên phân tích, tổng hợp các quy luật chính tả, ngữ âm tiếng Việt. Sau đây xin giới thiệu một vài tiêu chí mà bộ gõ vi-telex mã nguồn mở chạy trên môi trường Linux của nhóm m17n (Viện AIST, Nhật Bản) đã ứng dụng (xem www.m17n.org):

1. Sau nguyên âm mà gặp các phụ âm cuối không có trong tiếng Việt thì cho chuyển sang tiếng Anh đến hết từ, sau đây sẽ gọi là “temp-escape”, cụ thể là các phụ âm sau: q,d,g,h,k,l,z,v,b.

2. Với các phụ âm đã mượn làm dấu tiếng Việt s,f,j,r,x thì không thể temp-escape như thế mà phải dùng kiểu gõ lặp lại. Nhấn lần đầu là tạo dấu, nhấn lần nữa là hủy dấu đồng thời temp-escape luôn, người dùng phải chủ động trong quyết định này.

3. Tiếng Việt là đơn âm nên với các từ có hơn 1 âm cũng cho temp-escape khi phát hiện âm thứ 2, như từ “changes” khi gõ đến “e” sẽ temp-escape cho nên “s” không bị biến thành dấu sắc nữa.

4. DD/dd chỉ là Đ/đ khi đứng đầu từ, còn lại cho temp-escape, ví dụ từ address.

5. w chỉ là ư khi đi ngay sau phụ âm, hoặc sau u/a/o để tạo dấu, còn lại vẫn là w, ví dụ từ view sẽ không bị biến ra vieư.

6. z chỉ xóa dấu khi trước đó đã có nguyên âm được bỏ dấu, còn lại cho temp-escape.

Dự kiến có thể đưa ra môt tiêu chí nữa là nhận dạng các tổ hợp phụ âm đầu kép của tiếng Việt, nhưng có lẽ hiệu quả không cao vì các phụ âm đó (ch, kh, ng, ngh, nh, tr, th, ph) cũng có trong các ngôn ngữ Latinh… Đưa vào quá nhiều tiêu chí sẽ làm code lộn xộn thiếu sáng sủa, nhiều hơn nữa thì quay về phương án kiểm tra qua từ điển chính tả lại hợp lý hơn.

VI. Các xu hướng cải tiến bộ gõ tiếng Việt

Xu hướng phát triển chung là gắn thêm vào bộ gõ các phần kiểm tra chính tả và hỗ trợ tốc ký, hoặc mở rộng cho các thứ tiếng dân tộc ở VN như chữ Nôm, Tày, Thái, Chăm… đó là những cải tiến nên có, có dịp chúng tôi sẽ giới thiệu ở một bài khác.

Ở đây chỉ bàn tới những cải tiến còn gây tranh cãi, ví dụ một số người dùng muốn có kiểu bỏ dấu tự do (cả dấu thanh lẫn dấu mũ, dấu móc), nhưng phân tích kĩ thì thấy kiểu bỏ dấu tự do này chỉ phù hợp với VNI, chứ với Telex thì sẽ làm trầm trọng thêm nhược điểm khó gõ hỗn hợp Anh Việt. Vấn đề là do các phím dấu trong kiểu gõ Telex có hai chức năng tạo dấu và chữ cái nên dễ bị lẫn lộn, còn trong VNI chỉ có một chức năng tạo dấu thôi. Các từ như data, Japan, common, receive khi gõ Telex kiểu bỏ dấu tự do thì hóa ra dât, Jâpn, cômmn, rêcive… Phải sáng suốt trong vấn đề này, không nên vì những nhận xét kiểu gõ này “thông minh”, kiểu gõ kia không mà sa vào những cái phức tạp, ít hiệu quả thực tiễn. VNI thêm các cải tiến này cũng không hiệu quả đến mức áp đảo được các ưu điểm của Telex đã phân tích trên. Còn Telex “học” theo VNI cải tiến này cũng không có hiệu quả gì hơn nếu không nói là ngược lại. Ví dụ Telex tự do gõ chữ ôm = omo, đầu tiên là tên bột giặt “OMO” sẽ biến ra ÔM, làm nặng thêm khuyết điểm khó gõ hỗn hợp Anh Việt, sau nữa là rất nhiều người chỉ quen gõ một tay thì cự ly di chuyển sẽ xa thêm: từ phím O sang M rồi về O cự li di chuyển gần gấp đôi so với gõ đúp O rồi chuyển sang gõ M. Gõ “thông minh” chưa rõ có lợi gì, nhưng tốc độ thì đã thua kiểu gõ “chân quê”.

Phan Anh Dũng
R&D Department
Thua Thien Hue Center of Information Technology (Huesoft).

BÀN THÊM VỀ BẢN KIỀU DUY MINH THỊ 1872

BÀN THÊM VỀ BẢN KIỀU DUY MINH THỊ 1872

Nguyễn Tài Cẩn
Phan Anh Dũng

Đã đăng tạp chí Sông Hương No. 211, 9/2006, page 78-81


1/ Tiến sĩ Đào Thái Tôn vừa cho xuất bản cuốn “Nghiên cứu văn bản Truyện Kiều : bản Liễu Văn Đường 1871“. Chúng tôi thành thực hoan nghênh : hoan nghênh không phải vì trong cuốn sách đó có những chỗ chúng tôi được Tiến sĩ tỏ lời tán đồng, mà ngược lại, chính là vì có rất nhiều chỗ Tiến sĩ tranh luận, bác bỏ ý kiến của chúng tôi. Một sự tranh luận thẳng thắn bao giờ cũng là điều rất cần thiết, nhất là hiện nay, nếu muốn đẩy ngành Kiều học tiến lên (1)

Với tinh thần như vậy, dưới đây chúng tôi xin trao đổi thêm với Tiến sĩ về 2 vấn đề:

— Bản Kiều chép tay mà cụ H.X.Hãn đề cao có phải chính là một bản D.M.Thị không ?

— Và bản D.M.Thị là một bản nên xếp vào đâu ? Nó gần các bản Huế hơn hay là gần các bản hệ Thăng Long hơn ?

2/ Về vấn đề đầu, T.S. Đào Thái Tôn cho rằng trong bài nói của cụ H.X.Hãn “có một câu dễ khiến người đọc có thể hiểu như thế“(trang 83).Theo ý chúng tôi đó chỉ là một trong hệ thống những câu nói về nhiều chuyện khác nữa. Chúng đều chứng tỏ rằng Cụ pH.X.Hãn đang quan tâm đến một bản chép tay liên quan đến bản D.M.Thị, ví dụ như :

— Chuyện Cụ nói về những chi tiết cụ Nguyễn Du “lấy trong Kiều (2), viết ra y như thế, rồi những bản Nôm sau này người ta bỏ đi“. “Cái bản còn giữ nguyên vẹn những chi tiết … ấy là bản đầu tiên, ít ra gần với lời cụ Nguyễn Du hơn cả“.

— Chuyện Cụ về Tiên Điền hỏi cụ Nghè Mai về việc dùng TRƯỢNG NGHĨA thay cho TRỌNG NGHĨA để kị húy trong dòng họ; Cụ nói : “Trong Kiều thường thì nói “Mà lòng trọng nghĩa khinh tài xiết bao”, nhưng bản tôi đọc mà tôi cho là xưa nhất thì không đúng thế, mà viết TRƯỢNG NGHĨA “ ;

— Chuyện Cụ hỏi cụ Nghè Mai về đoạn Sở Khanh tán Kiều, và được trả lời : “ Trước cụ Nguyễn Du viết khác, rồi các cụ ngoài Bắc chữa lại. Cụ Nguyễn Du viết có 4 câu, các cụ chữa lại 6 câu “; Về câu trả lời đó, cụ H.X. Hãn bình luận : “lời cụ Nguyễn Mai nói về đoạn ấy phù hợp với bản tôi coi là xưa nhất “.

— Chuyện Cụ thông tin cho chúng ta biết : “có một bản ở trong Nam thấy đương còn những dấu vết hoàn toàn đời Gia Long. Không có đời Minh Mạng (3). Thì mình chắc chắn bản ấy người ta sao lại một bản từ đời Gia Long“. ”Vào khoảng 42-43 tôi đã thấy bản này rồi” … ”Hiện bây giờ có bản in, nhưng in sai rất nhiều, cho nên không mấy người để ý tới”. “Nhưng sự thực bản ấy là bản quí nhất“.

Cụ H.X.Hãn cho biết Cụ về điều tra ở dòng họ Tiên Điền vào những năm 1942, 1943. Vào những năm đó Cụ chỉ mới có được một số bản Kiều cổ viết tay chứ chưa có được một bản in nào của thế kỉ 19. Mặt khác, các chuyện Cụ đề cập đến trên đây lại đều là những chuyện chỉ liên quan đến một bản duy nhất : bản D.M.Thị (không kể đến hai bản T.V,Kí và A.D.Michels in sau, và chịu ảnh hưởng D.M.Thị). Quả vậy, trong số các bản Kiều cổ như bản LNP chép năm 1870, 2 bản LVĐ in năm 1866 và 1871, bản TVKí in năm 1875, hai bản QVĐ và TMĐ in năm 1879, bản A. D. Michels in năm 1884, bản có kí hiệu thư viện là VNB-60, bản của Nordemann in năm 1897, và bản K.O.Mậu biên tập trong khoảng 1889-1902…chỉ bản D.M.Thị là bản :

* Vừa có các câu bám sát nguyên tác Hán văn của T.T.T.Nhân, như

— Treo tranh Quan Thánh trắng đôi lông mày (câu 930)

— Mà chàng Thúc Thủ (thúc thủ) ra người bó tay (câu 2008)

— Trông chàng nàng cũng ra tình đeo đai (câu 1064)

………………..

* Vừa có TRƯỢNG NGHĨA thay cho TRỌNG NGHĨA :

— Mà lòng trượng nghĩa khinh tài xiết bao (câu 310)

* Vừa có 4 câu cụ Nguyễn Du sơ thảo :

Quế trong trăng, hạnh trên mây

Cát lầm nỡ để cho đầy đọa hoa

Tiếc điều nhầm chẳng biết ta

Vể châu vớt ngọc dễ đà như chơi

thay vì 6 câu 1067, 1068, 1069, 1070, 1071, 1072 đã được bạn bè chữa lại :

Giá đành trong nguyệt trên mây

Hoa sao hoa khéo giã giày với hoa

Nổi gan riêng giận trời già

Lòng này ai tỏ cho ta hỡi lòng

Thuyền quyên ví biết anh hùng

Ra tay tháo cũi sổ lồng như chơi

* Vừa có vết tích kị húy một cách triệt để theo lệnh năm 1803 đời Gia Long ( kị húy GIỐNG/CHỦNG 6 lần bằng thay từ và 1 lần bằng gia dạng trên tổng số 7 chỗ; kị húy LAN, thay bằng HƯƠNG cũng 7 lần trên 7 chỗ v.v.); thậm chí có khi kị húy một cách quá mức cần thiết, như kị húy động từ LAN trong CỎ LAN MẶT ĐẤT, hay kị húy thanh phù LAN trong chữ DAN !) .

Vậy rõ ràng bản Kiều chép tay mà Cụ Hãn đề cao là một bản sao lại từ bản D.M.Thị 1872 hay sao lại từ bản gốc của bản in này (4).

3/ Về vấn đề thứ hai thì chúng tôi chủ trương chia các bản Kiều thế kỉ 19 thành 3 nhóm, căn cứ theo địa bàn xuất hiện của chúng ở 3 miền khác nhau : các bản miền Bắc, các bản gốc Huế và các bản của miền Nam. T.S. Đào Thái Tôn, trái lại, chỉ phân thành hai hệ: hệ Thăng Long và hệ của kinh đô Huế. Bản D.M.Thị và bản Nordemann được tiến sĩ xếp vào hệ Huế.

Chuyện nên chia theo ba miền hay chia thành hai hệ và chuyện đặt bản Nordemann vào hệ Huế chúng tôi sẽ xin bàn trong một bài sau. Ở đây chúng tôi chỉ xin chứng minh rằng bản DM Thị có đặc điểm rất xa các bản LNP, KOM gốc Huế và rất gần với các bản miền Bắc, thuộc hệ Thăng Long, ngay nếu chỉ căn cứ đơn thuần trên các bảng điều tra của chính ngay tác giả (T.S. Đào Thái Tôn).

Từ trang 100 đến trang 169 T.S. Đào Thái Tôn đã lập những bảng có hình thức như sau:

– Ở cột phía bên trái là 5 bản miền Bắc, thuộc hệ Thăng Long, xếp theo thứ tự ABCDE: A là bản LVĐ 1866, B là bản LVĐ 1871, C là bản QVĐ 1879, D là bản TMĐ 1879 và E là bản có kí hiệu VNB-60 .

– Ở cột phía bên phải là 6 bản Tiến sĩ cho là thuộc hệ Huế, xếp theo thứ tự @GHIKL : @ là bản LNP, G là bản DMThị, H là bản TVKí, I là bản A.D Michels, K là bản Nordemann và L là bản KOMậu .

Trong các bảng vẽ này đang còn một số chỗ sơ suất nhất định nhưng tạm thời chúng tôi xin hoàn toàn tôn trọng tác giả ở các chỗ đó. Chúng tôi chỉ xin nêu 2 đề nghị :

– Tạm gác bản A /1866 vì bản này mất quá nhiều tờ, gây khó khăn cho việc tính toán;

– Và tạm coi bản K/1897 như một bản trung lập không ảnh hưởng gì đến 3 quá trình so sánh: DMThị với hệ Thăng Long, DMThị với hệ Huế, hệ Huế với hệ Thăng Long .

Chúng tôi chỉ chọn những câu có dị bản phổ biến, có mặt ở 6 bản trở lên trong tổng số 10 bản BCDE và @GHIKL vì đó là những trường hợp có thể rất gần với nguyên tác, dễ được mọi người tán thành. Làm như thế thì các bảng vẽ của T.S. Đào Thái Tôn sẽ đưa đến ba kết quả so sánh như sau :

I/ Ở BẢNG SO SÁNH BẢN DMT VỚI CÁC BẢN MIỀN BẮC (tức không có các bản HUẾ) chúng ta có 8 trường hợp với số lượng như sau (5) :

B C D E @ G H I K L
B C D E / G H I K / ở 56 câu, ví dụ câu 34
B C D E / G / I K / ở 12 câu, ví dụ câu 102
B C D E / G / I / / ở 6 câu, ví dụ câu 322
B C D E / G H I / / ở 5 câu, ví dụ câu 173
B C D / / G H I K / ở 2 câu, ví dụ câu 44
B C D E / G / / K / ở 2 câu, ví dụ câu 492
B C / E / G / I K / ở 1 câu 21
B C D E / G H / K / ở 1 câu 529

Như vậy trong tổng số các câu dùng những dị bản thuộc loại phổ biến, bản DMT đã có đến 85 câu giống y như bản LVĐ 1871 nói riêng, giống hầu hết các bản miền Bắc, nói chung.

II/ Ở BẢNG SO SÁNH CÁC BẢN MIỀN BẮC VỚI HAI BẢN GỐC HUẾ (tức không có các bản miền Nam) chúng ta lại có 5 trường hợp với số lượng như sau :

B C D E @ G H I K L
B C D E @ / / / K L ở 22 câu, ví dụ câu 20
B C D E @ / / / / L ở 9 câu, ví dụ câu 555
B C D E @ / / / K / ở 4 câu, ví dụ câu 486
B C D E / / / / K L ở 3 câu, ví dụ câu 25
B C D / @ / / / K L 1 câu, ví dụ câu 448

Ở đây rõ ràng chúng ta lại phải kết luận là bản LVĐ/ 1871, cũng như đa số các bản miền Bắc, đều chỉ có được 39 dị bản giống với hai bản gốc Huế. Sự gần gũi giữa DMT /1872 với LVĐ/1871 lớn hơn gấp đôi !

III / CÒN Ở BẢNG SO SÁNH HAI BẢN HUẾ VỚI BẢN DMT ( tức không có các bản miền Bắc) chúng ta lại chỉ có được 17 câu, theo một mô hình duy nhất là :

@ G H I K L ở 17 câu, ví dụ câu 84

Còn nếu coi NHỠ NHÀNG cũng như LỠ LÀNG, coi BẤY LÒNG cũng như MẤY LÒNG thì con số sẽ được nâng lên thành 17+2+1= 20 .Con số đó vẫn rẩt thấp : chỉ bằng ½ con số ở bảng thứ hai và bằng chưa đến ¼ con số ở bảng thứ nhất. Vậy bản DMT gần nhất với các bản miền Bắc (85 dị bản giống nhau), các bản miền Bắc hơi xa hai bản Huế (39 dị bản giống nhau), hai bản Huế lại xa nhất bản DMT (chỉ còn tối đa 20 dị bản chung). Cứ liệu tiến sĩ Đào Thái Tôn nghiên cứu trên cơ sở 1100 câu hoàn toàn ăn khớp với cứ liệu nghiên cứu toàn bộ Truyện Kiều của chúng tôi, so sánh :

Số dị bản giống nhau

ở Đào Thái Tôn           ở Nguyễn Tài Cẩn

— Quan hệ DMT với các bản miền Bắc :     85                                330

— Quan hệ các bản ở Bắc với ở Huế :         39                                93

— Quan hệ hai bản Huế với bản DMT :        20                                64

Rõ ràng phải để bản DMT thành một hệ riêng chứ không thể xếp nó vào trong cùng hệ Huế là hệ xa nó nhất.

Chú thích :

(1) : Đúng theo mong muốn của chúng tôi ! Trong cuốn “Từ bản DMT đến bản KOM”, trang 94, chúng tôi đã viết : ”Nếu chọn những dị bản quen thuộc thì chắc dễ được nhiều người tán thành. Nhưng mục đích của chúng tôi lại có phần khác: cố gắng gợi lên những khả năng mới, lật ngược vấn đề để gây tranh luận, kích thích tinh thần thích tìm tòi, thích khám phá . Đó là lí do vì sao chúng tôi hay quan tâm đến các dị bản lạ, bất ngờ, bị thiểu số.”

(2) : Tức lấy từ trong nguyên bản KIM VÂN KIỀU TRUYỆN của Thanh Tâm Tài Nhân .

(3) : Cụ H.X.Hãn chỉ nghĩ đến việc kị húy các tên của Gia Long, Minh Mạng nên kết luận theo chuyện thấy bản DMT kị húy CHỦNG nhưng vẫn dùng TÂM ĐẢM, chứ không đổi thành TÂM PHÚC như ở nhiều bản khác. Còn nếu nghĩ đến các lệnh kị húy thì bản DMT đã kị húy theo lệnh năm 1825 đời Minh Mạng: kị húy chữ ĐANG, tên mẹ của Minh Mạng.

(4) Những sự đánh giá của cụ H.X.Hãn nêu trên đây (như “bản đầu tiên”, bản “xưa nhất“, “bản quí nhất“ ) cũng chứng tỏ rằng Cụ đang nói về một bản sao liên quan đến bản DMT. Gần đây anh Nguyễn Văn Hoàn, anh Nghiêm Xuân Hãn cũng đều khẳng định lại là Cụ rất đề cao bản Kiều đó.

(5) Chúng tôi dùng một đường gạch xiên / dưới bản nào là muốn nói rằng bản đó vắng mặt.


Chúc tết Canh Dần

Nhấn vào ảnh để mở xem :