Mã hóa tri thức như thế nào?

Từ VLOS
Bước tới: chuyển hướng, tìm kiếm

Hồi bé thỉnh thoảng lại có phong trào kế hoạch nhỏ, nghĩa là phong trào ra chợ giấy lộn mua báo cũ về đem nộp cho trường làm … giấy lộn; phong trào đổ tiệt các thứ ra khỏi bất kỳ cái chai nào tìm thấy trong nhà để nộp chai tính điểm “dũng sĩ kế hoạch nhỏ”, khi nào may mắn lại được thêm vài cái “sao chiến công” dán vào một mảnh giấy vuông vuông đeo trên ngực, hiên ngang vào lớp.

Tôi nhìn lại môi trường xung quanh mình và chợt nhận ra mình đã quen thế nào với “kế hoạch nhỏ” ở đây. Tôi hầu như không bao giờ nghĩ đến sự tồn tại của chúng, chúng như không khí.

  • Ở cái chỗ đổ rác công cộng trong khu condo tôi ở, ngoài cái thùng rác 2mét x 2mét x 2mét to đùng ra thì còn có vài thùng nhỏ hơn, cao ngang ngực, thùng dành cho báo chí, thùng cho các lon thiếc, thùng cho chai lọ thủy tinh, thùng cho giấy carton.
  • Trong trường thì các thùng rác để khắp nơi: hành lang, gần cửa, sân, bãi xe buýt, … Mỗi vị trí có đến 3, 4 thùng đứng cạnh nhau với chức năng tương tự.
  • Tự nhiên khi bỏ rác ta bỏ vào đúng loại thùng. Chẳng cần giáo dục công dân gì sất.

Tôi cũng làm kế hoạch nhỏ trong học tập và nghiên cứu. Thường thì khi đọc hoặc nghĩ được cái gì mới tôi viết notes (trên giấy, trên máy, trên blog!) rồi bỏ chúng vào các cặp giấy, thư mục trong laptop, đề tài trong blog, … Chuyện này không phải lúc nào cũng làm được vì khá mất thời gian. Có không ít các quyển sách mà notes của tôi về chúng rất dài. Thậm chí có một số quyển tôi gần như chép lại sách theo ý mình hiểu. Ở Minneapolis có một quán cà fê trước cổng trường mà hồi còn đi học tôi chuyên môn ngồi “viết sách” kiểu này. Quán tên là Expresso Exposé. Khi nào bạn có dịp ghé Minneapolis, nên đến đường Washington ngồi quán này cho biết. Nhìn ra đường rất dễ chịu.

Càng lúc tôi càng nhận ra cái “hệ thống” mà mình tự động hóa kế hoạch nhỏ này có lợi về lâu về dài. Các bài báo kinh điển, sách hay, tôi phải đọc ít nhất 3 lần mới hiểu sơ sơ. (Có vài tầng “hiểu”, tầng thấp nhất của sự hiểu là khả năng trình bày lại toàn bộ bài báo cho người khác mà không cần notes và bài báo trong tay.) Hệ thống kế hoạch nhỏ này giúp cho các lần đọc sau rất nhiều. Qua một thời gian, gom các entries cùng đề tài nào đó của blog lại, tổ chức và thêm một ít suy nghĩ mới, là ta có thể có một bài viết không tệ.

Tôi đọc khá nhiều sách của Noam Chomsky (đặc biệt giới thiệu quyển Fateful Triangle), và luôn thấy rất ấn tượng rằng mỗi một sự kiện trong sách đều có các tham khảo rất kỹ lưỡng. Các citation của ông không phải kiểu citation lười như kiểu “đọc sách này thì biết”, mà ông cite các bài báo của các nhật báo chính xác đến từng số. Hiển nhiên ông phải có một “cơ sở dữ liệu” kế hoạch nhỏ được tổ chức rất tốt thì mới có thể cite các bài nhật báo từ hồi thập niên 50, 60.

Nếu Chomsky cũng làm kế hoạch nhỏ thì kế hoạch đó hẳn là không nhỏ.

Bên gỡ rối tơ lòng, bạn tvhvt có câu hỏi thú vị: "Sử dụng ngôn ngữ gì để mã hóa và lưu trữ thông tin, tri thức?"

Nói chung, tôi mã hóa thông tin/tri thức học được bằng một algorithm/generative model. Thông tin/tri thức nào có Kolmogorov complexity càng thấp thì tôi nhớ càng lâu, hiểu càng sâu. Nói cách khác, sự đơn giản của algorithm và/hoặc sự đơn giản của generative model tạo thông tin đó tỉ lệ nghịch với độ dễ hiểu và dễ nhớ của thông tin.

Xin giải thích lại đoạn văn trên bằng tiếng Việt như sau.

Tôi đã viết là khi đọc một quyển sách mới, tôi thường có thói quen “viết lại” sách theo ý mình. Viết lại theo nghĩa đen, hoặc ghi rất nhiều notes ở khắp nơi (trên giấy, trên blog, v.v.). Tôi cho rằng cá nhân mình chưa thật sự hiểu một môn học nào đó cho đến khi mình có thể từ một lượng data rất nhỏ là đã có thể tự xây dựng lại nền tảng lý thuyết của môn đó. Cách tốt nhất để thử xem mình có hiểu môn học không là trình bày lại toàn bộ môn học mà không cần bất kỳ tham khảo gì xung quanh mình (Internet, sách vở, v.v.). Vì thế, tôi đi giảng bài trong lớp không bao giờ mang notes/books theo. Với các môn lý thuyết thì 95% số lectures là tôi vào lớp với vài cục phấn. Năm phần trăm còn lại, phải mang notes theo, là dành cho các đề tài tôi chưa thật sự hiểu.

Để làm được như thế, ta không thể nào đọc/học theo kiểu cưỡi ngựa xem hoa. Trước khi đọc chứng minh một định lý nào đó, tôi luôn dành một ít thời gian thử tự chứng minh nó. Nếu quyển sách viết rất tốt thì chúng ta thật sự không cần đọc nhiều chứng minh cho lắm (trừ các định lý cực kỳ bất ngờ, là đột phá trong ngành!).

Trong các ví dụ trên tôi dùng các môn lý thuyết làm dẫn chứng. Đối với các môn kỹ thuật hơn một chút, networking chẳng hạn, thì có cực kỳ nhiều chi tiết kỹ thuật lắt nhắt khó nhớ. Điều này đúng cho hầu hết các ngành engineering phải giải quyết các vấn đề thực tế. Generative model của mình sẽ phải deal với nhiều noise. Trong trường hợp này, tôi sẽ cố tạo generative model cho các ý tưởng chính của ngành: nguyên tắc KISS, distributive tốt hơn centralized, local tốt hơn global, ARQ, randomization, v.v. Sau một thời gian, ta sẽ thấy là tổng số ý tưởng original trong networking có thể đếm trên đầu ngón tay. Còn lại chỉ là các biến thể be bé để giải quyết nhiễu.

Đoạn trên có … nhiễu quá không?

Nguồn[sửa]