15 July 2016

Nhà động vật học Burrhus Frederic Skinner (1904 – 1990) và các nghiên cứu kỳ lạ

 Burrhus Frederic Skinner (1904 – 1990)

Thời gian B.F Skinner bước vào con đường nghiên cứu Tâm lý học trùng với thời gian giới tâm lý Hoa Kỳ đang có sự chuyển biến mạnh mẽ sau bức thư “Tâm lý học dưới quan điểm của nhà hành vi học Psychology as the Behaviorist Views It” (John B. Watson, 1913). Chính Watson đã khơi mào một cuộc “nổi dậy” chống lại các quan điểm Phân tâm học đang thống trị ngành Tâm lý thế giới bấy giờ.
“Công thức” nổi tiếng của Watson: Kích thích (Stimulus) à Phản ứng (Response). Các kích thích (S) từ môi trường sống xung quanh định hình nên các hành vi ( R ) của con người. Những kinh nghiệm, hành động hay thậm chí tính cách, năng lực, thói quen của chúng ta cũng đến từ tiếp xúc với các kích thích môi trường. Và, B.F. Skinner là người đã nâng học thuyết Hành vi lên một bậc cao mới góp phần đưa nó trở thành trào lưu thống trị Tâm lý Hoa Kỳ suốt nhiều thập niên đầu thế kỷ 20.

Đến đây cũng cần nói thêm một chút để giúp mọi người tránh nhầm lẫn giữa các khái niệm then chốt trong học thuyết hành vi: điều kiện cổ điển (phản xạ có điều kiện) và điều kiện tạo tác (phản xạ tạo tác/thao tác).

Điều kiện cổ điển (classical conditioning) được mô tả bởi nhà sinh lý học người Nga Ivan Pavlov. Nó bao gồm việc đặt một tín hiện trung tín trước một phản xạ. Tập trung trên sự không tự nguyện, hành vi tự động. Điều kiện thao tác (operant conditioning) được mô tả đầu tiên bởi nhà tâm lý học người Mỹ B.F. Skinner. Liên quan đến việc áp dụng sự củng cố hoặc trừng phạt sau một hành vi. Tập trung vào việc tăng cường hay làm yếu đi các hành vi tự nguyện

Điều kiện cổ điển liên quan đến việc kết đôi giữa một kích thich trung tính (chẳng hạn như âm thanh của tiếng chuông) và một kích thích vô điều kiện (mùi vị của thức ăn). Kích thích không điều kiện này tự động và tự nhiên gây nên sự thèm thuồng như phản ứng với thức ăn, được biết đến như là các phản ứng vô điều kiện (unconditioned response). Sau khi có sự liên kết giữa các kích thích trung tính và các kích thích vô điều kiện, âm thanh của tiếng chuông (kích thích trung tính) khi đi một mình cũng làm phát sinh sự thèm thuồng thức ăn như là một phản ứng. Âm thanh của tiếng chuông bây giờ gọi là kích thích có điều kiện (conditioned stimulus) và sự thèm thuồng thức ăn khi phản ứng với tiếng chuông gọi là phản xạ có điều kiện (conditioned reflection) hay điều kiện cổ điển (classical conditioning).

Điều kiện thao tác tập trung vào việc sử dụng hoặc củng cố (reinforcement) hoặc trừng phạt (punishment) để làm gia tăng hoặc giảm thiểu một hành vi. Thông qua quá trính này, một mối liên kết được hình thành giữa hành vi và hệ quả của hành vi đó. Ví dụ: một huấn luyện viên cố gắng dạy chú chó chạy đi lấy quả bóng. Khi con chó trượt theo và nhặt thành công quả bóng đem về, chú chó nhận được phần thưởng khen ngợi. Khi chú thất bại, huấn luyện viên giữ lại phần thưởng. Cuối cùng, chú chó hình thành nên mối liên kết giữa việc nhặt quả bóng với nhận được phần thưởng.

Một trong những cách đơn giản nhất để phân biệt giữa điều kiện cổ điển và điều kiện thao tác là xem xét hành vi là tự động hay tự nguyện. Điều kiện cổ điển liên quan đến việc tạo mối liên kết giữa một phản xạ không tự nguyện (tự động) và một kích thích; trong khi đó điều kiện tạo tác tạo mối liên kết giữa một hành vi tự nguyện và hệ quả của nó.

Trong điều kiện thao tác, người học được nhận ưu đãi (phần thưởng/lời khen…), trong khi điều kiện cổ điển không cho ưu đãi. Một điều nên nhớ khác là điều kiện cổ điển là một phần thụ động của người học, trong khi điều kiện thao tác đòi hỏi tính tích cực tham gia một số loại hành động nhằm được nhận phần thưởng hay trừng phạt.

Toàn bộ học thuyết của Skinner xoay quanh điểm cốt lõi: điều kiện thao tác (operant conditioning). Skinner đã phát hiện ra một yếu tố ảnh hưởng đến hành vi tạo tác của con người là kích thích củng cố (reinforcing stimulus). Những kích thích này thúc đẩy gia tăng tần số thực hiện lại hành vi nào đó trong tương lai. Khi thực hiện hành vi sẽ đưa đến một kết quả nhất định, và chính kết quả này lại quay trở lại tác động khiến hành vi lặp lại.
Một thực nghiệm hết sức nổi tiếng của Skinner là “hộp Skinner/ Skinner’s box”, đầu tiên được tiến hành trên chuột (1948). Skinner cho 1 con chuột vào chiếc lồng (như hình), trong lồng có 1 đòn bẫy mà khi nhấn vào đó sẽ có những viên thức ăn từ hộp đựng theo ống dẫn rớt vào khay ăn. Ngoài ra, còn có loa để phát ra các tín hiệu âm thanh, 2 đèn tín hiệu (1 đỏ,  1 xanh) để kiểm chứng các quy luật ảnh hưởng đến hành vi của chuột. Trên sàn lồng có lưới điện được nối với máy phát điện tạo sốc nhằm tạo tác nhân trừng phạt để kiểm tra khả năng làm suy giảm tần suất của hành vi.
Skinner tiến hành các phiên thực nghiệm và rút ra các nhận định quan trọng:

Củng cố liên tục (continuous reinforcement): tưởng thường cho hành vi mong đợi (nhấn nút đòn bẩy) mỗi lần hành vi này diễn ra. Đây là biện pháp thường được tiến hành vào khởi đầu của bất kỳ việc định hình hành vi vì nó tạo sợi dây liên kết mạnh mẽ giữa hành vi và phản ứng (hệ quả của hành vi đó). Ví dụ: mỗi lần nhấn đón bẫy thì đều có viên thức ăn rơi xuống khay.

Dùng chim bồ câu dẫn đường cho tên lửa 
Lịch trình tỉ lệ cố định (fixed-ratio schedules): cung cấp phần thưởng sau một số lần nhất định các phản ứng. Ví dụ: chuột phải nhấn 3 lần thì mới có viên thức ăn rơi ra; hoặc sau khi loa phát 3 tiếng chuông (hoặc 2 tiếng chuông và 1 lần nhấp nháy đèn tín hiệu…) thì nhấn đòn bẫy mới có tác dụng làm rơi viên thức ăn…

Lịch trình tỉ lệ biến đổi (variable-ratio schedules): cung cấp phần thưởng sau một số lần hành vi diện ra bất kỳ. Nó làm gia tăng độ ổn định của phản ứng, khiến đối tượng tăng ham muốn thử làm hành vi đó. Ví dụ: chuột nhấn 3 lần có viên thức ăn, lần sau phải nhấn tới 7 lần, lần sau nữa chỉ cần nhất 1 lần…

Lịch trình thời gian nghỉ cố định (fixed-interval schedules): chỉ cung cấp phần thưởng sau một thời gian nghỉ nhất định. Lịch trình này làm tăng phản ứng khi thời gian nghỉ gần kết thúc và làm chậm phản ứng khi vừa nhận được sự củng cố. Ví dụ: Sau 30 giây kể từ lúc nhấn đòn bẩy lần đầu tiên thì mới làm rơi viên thức ăn.

Dùng chim bồ câu dẫn đường cho tên lửa 
Lịch trình thời gian nghỉ biến đổi (variable-interval schedules): sau những khoảng thời gian nghỉ bất kỳ từ lần đầu tiên phản ứng thì mới nhận được phần thưởng. Lịch trình này mất thời gian khá lâu để quen với thủ tục nhưng mức độ ổn định cao của việc thực hiện phản ứng. Ví dụ: chuột phải chờ 3 phút, 2 phút, 5 phút, rồi 1 phút… sau khi nhấn đòn bẩy (hoặc nhấn đòn bẩy sau khi đèn nhấp nháy 3 phút, 2 phút, 5 phút, 1 phút…) mới nhận được viên thức ăn.

Củng cố tiêu cực (negative reinforcing) làm gia tăng hành vi sau khi loại bỏ đi các điều kiện gây khó chịu. Ví dụ: con chuột bị sốc bởi dòng điện nhỏ khi đi qua 1 gốc hộp, sau một thời gian dừng khời động sốc điện, con chuột tăng số lượng hành vi đi lại gốc hộp (trước đây bị sốc điện).

Dùng chim bồ câu dẫn đường cho tên lửa 
Skinner cũng hình thành học thuyết về sự định hình (shaping) hành vi của con người. Theo ông chính sự định hình hành vi này tạo nên nhân cách cá nhân. Skinner  cho rằng dù phức tạp đến đâu thì các hành vi của con người cũng có thể phân tích thành các chuỗi hành vi nhỏ hơn, hành vi sau bao hàm và liên kết với hành vi trước và được nối kết bới các tác nhân củng cố. Ví dụ, chú chuột học được cả quy trình tương đối phức tạp như: chạy theo đường nhất định từ gốc này của hộp, tránh chạm phải các phần có dòng điện, chờ tín hiệu đèn nhấp nháy, nhấn đòn bẩy một số lần nhất định và tiếp tục chờ một khoảng thời gian nghỉ để nhận được các viên thức ăn. Với con người thì có thể phức tạp hơn để giải thích. Ví dụ: một đứa trẻ tò mò về xung quanh, được mua cho kính viễn vọng, cùng cha về miền quê ngắm sao, thích thú tìm hiểu thiên văn học, học đại học ngành vật lý thiên văn và theo đuổi nghề nghiệp vì đạt thành tích được tưởng thưởng và trở thành một nhà khoa học được kính trọng. Điều này cũng đặt nền mống (và sau này các nhà tâm lý học hành vi khác sẽ hoàn thiện thêm lý thuyết) cho các thủ thuật trị liệu gọi là “giải mẫn cảm hệ thống” (systematic desensitization) và “tràn ngập” (over flooding).
 Sơ đồ điều kiện hóa hành động ở chim bồ câu với hộp Skinner
Ông phản đối dùng các biện pháp trừng phạt (punishment) vì cho rằng nó không có hiệu quả nhiều trong thay đổi hành vi. Ví dụ: trẻ bị đánh khi chửi bậy trước mặt ba mẹ à sợ không nói trước mặt à nói bậy khi không có mặt ba mẹ, không bị phạt à hình thành “lịch trình củng cố thời gian nghỉ cố định/thay đổi”, trẻ tăng các hành vi nói bậy ở nơi không có ba mẹ.

Tên lửa dẫn đường bằng... chim bồ câu
Một vấn đề thú vị khác là sự điều chỉnh hành vi (behavior modification). Skinner đề xuất một lộ trình để cải tạo hành vi của cá nhân bằng cách hạn chế dần củng cố tiêu cực và tăng tác nhân củng cố tích cực để dần xây dựng một hành vi mới lành mạnh hơn. Ví dụ, tù nhân được thưởng thuốc lá hay thêm thời gian thư giãn khi tích đủ điểm rèn luyện tốt. Quan điểm này cũng được áp dụng nhiều trong các chiến dịch kích cầu tiêu dùng trong kinh tế.

Skinner không cho rằng con người thật sự có tự do và phẩm cách theo nghĩa mà các nhà triết học quan niệm. Với ông, người tốt làm việc tốt vì chính nó phần thưởng với họ và ngược lại; chúng ta thật sự chỉ là một phức hợp các chuỗi được định hình từ môi trường tương tác xung quanh mà thôi. Ông xây dựng một mô hình (trong tiểu thuyết nhiều tranh cải “Walden II” nhằm tạo ra một môi trường có đủ các củng cố tích cực để khuyến khích các hành vi mong muốn và triệt tiêu các hành vi tiêu cực.
Tên lửa dẫn đường chim bồ câu được phát triển bởi nhà khoa học hành vi BF Skinner trong dự án Pigeon. Mặc dù cuối cùng dự án đã bị huỷ bỏ vì tính phi thực tế của loại vũ khí này, ý tưởng về tên lửa dẫn đường chim bồ câu cũng cho thấy những hứa hẹn nhất định.
Tên lửa có một loạt các ống kính ở mặt trước phản chiếu hình ảnh mục tiêu vào màn hình bên trong. Chim bồ câu sẽ mổ vào các mục tiêu trên màn hình. Những cú mổ của các chú chim bồ câu giúp định hướng đường đi của tên lửa. 
Từng được ứng dụng trong quân sự thời chiến tranh thế giới thứ 2 những năm 1930-1945
Lê Thành Nhân (tổng hợp và biên soạn) 

0 nhận xét:

Post a Comment

 

BACK TO TOP

Xuống cuối trang