Sự củng cố và trừng phạt
Reinforcement and Punishment
Một số sự kiện hoạt động cực kỳ hiệu quả như một tác nhân củng cố cho một số cá nhân chứ không phải những người khác. Cân nhắc xem một số người sẽ chơi một trò chơi điện tử trong bao nhiêu giờ chỉ để đạt điểm cao. Trong một thí nghiệm kỳ quặc, chuột mẹ có thể nhấn một đòn bẩy để đưa thêm chuột con vào lồng của chúng. Chúng tiếp tục nhấn và nhấn, ngày càng có nhiều chuột con (Lee, Clancy, & Fleming, 1999). Có mô hình nào về tác nhân củng cố tốt và tác nhân củng cố không tốt?
Chúng ta có thể đoán rằng tác nhân củng cố hữu ích về mặt sinh học cho cá nhân, nhưng nhiều người thì không. Ví dụ, saccharin, một hóa chất có vị ngọt nhưng vô dụng về mặt sinh học, có thể là một chất củng cố. Đối với nhiều người, rượu và thuốc lá là những tác nhân củng cố mạnh hơn các loại rau giàu vitamin. Vì vậy, tính hữu ích sinh học không xác định sự củng cố.
Một cách hữu ích để xác định sự củng cố dựa trên khái niệm về sự cân bằng. Nếu bạn dành cả ngày của mình theo bất kỳ cách nào bạn muốn, thì trung bình bạn sẽ phân chia thời gian của mình như thế nào? Giả sử bạn dành 30% thời gian trong ngày để ngủ, 10% để ăn, 8% để tập thể dục, 11% đọc sách, 9% nói chuyện với bạn bè, 2% chải chuốt, 2% chơi piano, v.v. Bây giờ, giả sử có điều gì đó khiến bạn tránh xa một trong những hoạt động này trong một hoặc hai ngày. Một cơ hội để thực hiện hoạt động đó sẽ giúp bạn trở lại trạng thái cân bằng. Theo nguyên tắc mất cân bằng (disequilibrium principle) của sự củng cố, bất cứ thứ gì ngăn cản một hoạt động tạo ra sự mất cân bằng và cơ hội để trở lại trạng thái cân bằng sẽ là củng cố (Farmer-Dougan, 1998; Timberlake & Farmer-Dougan, 1991)
Tất nhiên, một số hoạt động nhất quán hơn những hoạt động khác. Nếu bạn đã bị thiếu oxy, cơ hội để thở đang củng cố vô cùng mạnh mẽ. Nếu bạn bị tước đi thời gian đọc sách hoặc thời gian nói chuyện điện thoại, giá trị củng cố sẽ ít hơn
Tác nhân củng cố sơ cấp và thứ cấp
Primary and Secondary Reinforcers
Các nhà tâm lý học phân biệt giữa tác nhân củng cố sơ cấp ( primary reinforcers) (hoặc củng cố không điều kiện) đang tăng cường vì các đặc tính tự có và tác nhân củng cố thứ cấp (secondary reinforcers) (hoặc củng cố có điều kiện) trở thành củng cố bằng cách liên kết với một điều kiện khác. Thức ăn và nước uống là những tác nhân củng cố sơ cấp. Tiền (một tác nhân củng cố thứ cấp) trở thành củng cố bởi vì chúng ta có thể đổi nó lấy thức ăn hoặc những tác nhân củng cố sơ cấp khác. Một sinh viên biết rằng điểm tốt sẽ được thừa nhận và một nhân viên biết rằng năng suất tăng lên sẽ giành được sự khen ngợi của người chủ. Trong những trường hợp này, thứ cấp có nghĩa là “đã học.” Nó không có nghĩa là không quan trọng. Chúng ta dành phần lớn thời gian để làm việc cho các tác nhân củng cố thứ cấp.
Trừng phạt
Punishment
Ngược lại với củng cố, trừng phạt (punishment) làm giảm tần suất của phản ứng. Một tác nhân củng cố có thể là sự hiện diện của một điều gì đó (ví dụ, nhận thức ăn) hoặc loại bỏ (ví dụ, ngừng đau). Tương tự, trừng phạt có thể là hiện diện của một điều gì đó (ví dụ, nhận nỗi đau) hoặc loại bỏ (ví dụ: từ chối thức ăn). Trừng phạt có hiệu quả nhất khi nó diễn ra nhanh chóng và có thể đoán trước được. Một sự trừng phạt không chắc chắn hoặc chậm trễ sẽ kém hiệu quả hơn. Ví dụ, vết bỏng mà bạn cảm nhận được khi chạm vào lò nướng nóng có hiệu quả cao trong việc dạy bạn điều gì đó để tránh. Lời cảnh báo rằng hút thuốc lá có thể gây ung thư cho bạn cũng có thể có hiệu quả trong nhiều năm kể từ bây giờ, nhưng ít hơn. Trừng phạt không phải lúc nào cũng hiệu quả. Nếu lời đe dọa trừng phạt luôn có hiệu quả, tỷ lệ tội phạm sẽ bằng không.
Skinner (1938) đã thử nghiệm trừng phạt trong một nghiên cứu nổi tiếng trong phòng thí nghiệm. Đầu tiên, ông huấn luyện những con chuột thiếu thức ăn nhấn thanh chắn để lấy thức ăn và sau đó ông ngừng củng cố việc nhấn của chúng. Trong 10 phút đầu tiên, một số con chuột không những không lấy được thức ăn mà còn nhận một cú tát trời giáng mỗi khi chúng nhấn vào thanh chắn. (Thanh chắn đập vào chân.) Những con chuột bị trừng phạt tạm thời ngừng nhấn thanh chắn, nhưng về lâu dài, số lần chúng nhấn thanh cũng tương đương với lũ chuột không bị trừng phạt. Skinner kết luận rằng hình phạt không tạo ra ảnh hưởng lâu dài.
Tuy nhiên, kết luận đó là một sự cường điệu (Staddon, 1993). Một kết luận đúng hơn sẽ là trừng phạt không làm suy yếu đáng kể phản ứng khi không có phản ứng nào khác. Những con chuột thiếu thức ăn của Skinner không còn cách nào khác để tìm kiếm thức ăn. (Nếu ai đó phạt bạn vì thở, dù thế nào thì bạn vẫn sẽ tiếp tục thở.)
Tuy nhiên, các lựa chọn thay thế cho trừng phạt thường hiệu quả hơn. Làm thế nào chúng ta có thể yêu cầu người lái xe tuân theo các giới hạn tốc độ trong khu vực trường học? Cảnh báo họ về tiền phạt không hiệu quả lắm. Ngay cả việc cảnh sát đóng chốt trong khu vực cũng hiệu quả hạn chế. Một quy trình hiệu quả đáng ngạc nhiên là dán biển báo phản hồi của người lái xe có ghi giới hạn tốc độ và thông báo “tốc độ của bạn” dựa trên cảm biến radar (Goetz, 2011). Chỉ cần nhận được phản hồi của từng cá nhân thôi cũng sẽ nâng cao nhận thức của người lái xe về luật và khả năng tuân thủ theo luật.
Trừng phạt thân thể đối với trẻ em, chẳng hạn như đánh đòn, là cách tốt hay xấu? Đánh đòn là phạm pháp ở nhiều quốc gia, chủ yếu là ở Châu Âu (Zolotor & Puzia, 2010). Nhiều nhà tâm lý học không khuyến khích việc đánh đòn, khuyến cáo rằng cha mẹ chỉ cần nói lý lẽ với trẻ hoặc sử dụng các phương pháp kỷ luật phi vật lý, chẳng hạn như hết giờ hoặc mất quyền xem ti vi hoặc các đặc quyền khác. Bằng chứng nào ủng hộ khuyến nghị này?
Tất cả các nghiên cứu đều trình bày mối tương quan giữa trừng phạt thân thể và các vấn đề về hành vi. Những đứa trẻ thường xuyên bị đánh đòn có xu hướng cư xử không tốt. Bạn sẽ thấy vấn đề khi giải thích kết quả này: Điều đó có thể có nghĩa là việc đánh đòn gây ra hành vi sai trái, hoặc có thể có nghĩa là những đứa trẻ cư xử không tốt kích động cha mẹ đánh đòn chúng. Nó cũng có thể có nghĩa là việc đánh đòn phổ biến hơn đối với các gia đình gặp tâm lý căng thẳng, các gia đình có nhiều xung đột giữa cha mẹ hoặc các gia đình có các yếu tố khác có thể dẫn đến hành vi sai trái (Morris & Gibson, 2011). Một loại hình nghiên cứu tốt hơn là so sánh những đứa trẻ thường xuyên bị đánh đòn – với những đứa trẻ có hoàn cảnh tương tự, (những đứa trẻ thường xuyên bị trừng phạt kiểu khác (kiểu không đánh đòn thân thể, chẳng hạn như cho khoảng thời gian suy nghĩ 1 mình). Loại nghiên cứu đó cho thấy không có sự khác biệt giữa những người bị đánh đòn và những người được đưa ra các hình phạt khác (Larzelere, Cox, & Smith, 2010). Vì vậy, dường như hành vi sai dẫn đến hình phạt (bất kỳ dạng nào) nhiều hơn hình phạt dẫn đến hành vi sai trái.
Các kết luận khác nhau đối với hình phạt nghiêm khắc liên quan đến lạm dụng trẻ em. Các kết quả có thể xảy ra sau đó bao gồm hành vi chống đối xã hội, tự hạ thấp bản thân và thù địch với cha mẹ (Larzelere & Kuhn, 2005), cũng như tăng nguy cơ mắc các vấn đề sức khỏe suốt đời (Hyland, Alkhalaf, & Whalley, 2013)
Các loại củng cố và trừng phạt
Categories of Reinforcement and Punishment
Như đã đề cập, tác nhân củng cố có thể là đưa ra một cái gì đó như thức ăn hoặc tránh một điều gì đó như đau. Các hình phạt có thể xảy ra bao gồm biểu hiện đau đớn hoặc không được ăn. Các nhà tâm lý học sử dụng các thuật ngữ khác nhau để phân biệt những khả năng này, như thể hiện trong ■ Bảng 6.1.
Cả phía trên bên trái và phía dưới bên phải của bảng đều biểu thị về sự củng cố. Sự củng cố luôn làm tăng xác suất của một hành vi. Sự củng cố có thể là sự củng cố tích cực – củng cố dương tính (positive reinforcement) — đưa ra thứ gì đó chẳng hạn như thức ăn, hoặc sự củng cố tiêu cực – củng cố âm tính (negative reinforcement) — tránh/loại bỏ điều gì đó chẳng hạn như cái đau. Nhiều người thấy thuật ngữ củng cố tiêu cực khó hiểu hoặc gây hiểu lầm (Baron & Galizio, 2005; Kimble, 1993), và hầu hết các nhà nghiên cứu thích các thuật ngữ học tập trốn tránh hoặc học tập tránh né (escape learning or avoidance learning). Cá nhân được củng cố bởi một cơ hội để thoát khỏi hoặc tránh nguy hiểm. Bất kể sự củng cố đến từ việc đạt được điều gì đó mong muốn hay tránh điều gì đó không mong muốn, các tác động lên hành vi là như nhau (Mallpress, Fawcett, McNamara, & Houston, 2012)
Trừng phạt luôn làm giảm tần suất của một hành vi. Trong Bảng 6.1, các mục phía trên bên phải và phía dưới bên trái cho thấy hai loại trừng phạt. Trừng phạt có thể là thể hiện một cái gì đó chẳng hạn như nỗi đau, hoặc loại bỏ một cái gì đó chẳng hạn như thức ăn hoặc quyền lợi. Trừng phạt phạt bằng cách loại bỏ điều gì đó đôi khi được gọi là trừng phạt tiêu cực – trừng phạt âm tính ( negative punishment.).
Để phân loại các quy trình, hãy chú ý đến cách diễn đạt. Nếu quá trình làm tăng một hành vi, thì đó là sự củng cố. Nếu nó làm giảm một hành vi, đó là sự trừng phạt. Nếu tác nhân củng cố là sự hiện diện của một cái gì đó, nó là sự củng cố tích cực. Nếu tác nhân củng cố là sự vắng mặt của một thứ gì đó thì đó là sự củng cố tiêu cực, còn được gọi là học tập trốn tránh hoặc học tập tránh né.
Source: Kalat, J. W. (2017). Introduction to psychology (11ed). Boston, MA: Cengage Learning.