Prevendo Tomada de Decisão por meio da Atividade Cerebral
Prever o que outro irá decidir é um grande desafio da Economia e, mais recentemente, da Economia Comportamental. Contudo, a complexidade humana fez com que as Neurociências entrassem para estudar os processos decisórios mais a fundo ao verificar a relação entre o processamento cerebral e o comportamento. Na junção de Economia, Economia Comportamental, Psicologia Cognitiva e Social com as Neurociências, surge a Neuroeconomia, que vem avançando a passos largos na compreensão do processamento cognitivo e dos processos decisórios.
A Economia Comportamental já havia apontado a racionalidade limitada do ser humano, que utiliza heurísticas e muitas vezes sofre vieses pois nem sempre as heurísticas são suficientes para o processamento de tanta informação que se tem acesso na atualidade. Daniel Kahneman (2011), ganhador de prêmio Nobel de Economia, traz seus estudos sobre as heurísticas e os dois sistemas cognitivos que operam no ser humano: o sistema 1 automático e o sistema 2 controlado. O sistema 1 está ativo a maior parte do tempo e pode nos levar a cometer muitos erros que, por meio dos estudos, são previsíveis. Outros autores, como Richard Thaler, que ganhou o último prêmio Nobel de Economia e Dan Ariely, ambos economistas comportamentais, também vêm apontando a previsibilidade da irracionalidade humana. Contudo, ainda não se sabe como todas as variáveis modulam nossos processos decisórios e falta maior detalhamento para uma compreensão mais profunda desses processos e dos erros decisórios. A Neuroeconomia entra nesse “gap” elucidando como de fato o cérebro humano processa, julga e avalia as opções até finalmente o comportamento decisório ser executado.
A Neurociência Cognitiva provou que a maior parte das informações são processadas em nível automático e que o cérebro cria a ilusão de que se tem total controle sobre as ações. Esta discussão hoje está avançando na área do Direito (“Neurolaw”), sobre a real existência do livre-arbítrio, uma vez que o ser humano não tem consciência de muitos processos e pode ter reações automáticas que não passaram pelo nível da consciência. Não é o objetivo do presente artigo discutir esse tópico, mas sua origem se deu nos estudos das bases neurobiológicas da tomada de decisão: o cérebro muitas vezes decide antes mesmo que se tenha consciência disso.
Nesse sentido, um dos objetivos dos estudos da Neuroeconomia é poder prever decisões de risco, de segurança, de cooperação, reciprocidade e altruísmo, para citar alguns exemplos, por meio do registro da atividade cerebral, da fase de processamento inicial da informação até a consciência de fato da escolha. O EEG (eletroencefalografia) é uma técnica que vem sendo amplamente utilizada com o objetivo de compreender o processamento da informação com precisão de milissegundos, ideal para entender os processos automáticos e controlados na tomada de decisão. Esta técnica vem sendo considerada a medida de “tempo de reação” do século XXI (LUCK, 2005). O registro da atividade cerebral por meio de eletrodos no escalpe investiga os componentes cognitivos, também chamados de Potencial Relacionado a Evento (ERP, do termo em inglês “event-related potential”) que são uma variação da voltagem elétrica gerada pela atividade de um grupo de neurônios ao longo do tempo do processamento da informação em resposta à apresentação de um estímulo que é observado como ondas, picos e vales, positivos e negativos (LUCK, 2005). Segundo Bartholow e Amodio (2009), os ERPs representam a atividade neuronal de processamento de informações específicas em relação a um estímulo ou à resposta de um evento. Os ERPs refletem os potenciais pós-sinápticos das células neuronais do córtex.
San Martín et al. (2013) investigaram, pela análise dos ERPs a tendência de as pessoas buscarem a maximização de ganhos e a minimização de perdas por meio de um jogo probabilístico. Os autores descobriram que o componente parietal, P300b (uma onda positiva em torno de 300 milissegundos na área parietal cerebral), previa a maximização de ganhos (diferença de amplitude do P300b entre o menor e os melhores ganhos) e minimização das perdas (diferença entre as perdas piores e as menos más). Os autores atribuem o aumento da amplitude desse componente à maior atenção alocada para grandes recompensas. Além disso, grandes recompensas provavelmente induziriam maior excitação do que pequenos ganhos, devido ao maior impacto sobre os ganhos acumulados no jogo. Já o componente P300a, que se localiza na área fronto-central, previu o ajuste comportamental nas rodadas subsequentes. Os autores atribuem essa relação entre a amplitude do P300a e o ajuste do comportamento a um mecanismo adaptativo específico pelo qual a experiência prévia pode alterar o comportamento subsequente. Ou seja, a diferença individual na maximização de ganhos e minimização de perdas está relacionada a uma rápida resposta neural aos resultados monetários.
Recentemente, Gu et al (2017), investigaram por meio do EEG a atividade eletrofisiológica imediatamente precedente à decisão tanto de risco quanto segura, em uma tarefa de tomada de decisão de risco, o Balloon Analogue Risk Task (BART). Nessa tarefa, o participante tem um balão que deve ser inflado para o participante ganhar de 5 a 10 pontos a cada inflada. O participante poderia coletar o dinheiro acumulado quando desejasse. Porém, se o balão estourasse o jogador perdia tudo. Quanto mais inflasse o balão, maior seria o risco de explodir. Portanto, o participante teria múltiplas rodadas de tomada de decisão, sendo que recolher o dinheiro logo seria uma decisão segura e continuar a inflar o balão seria uma decisão de risco.
Os resultados comportamentais mostraram que, quanto maior o risco, mais tempo os participantes levavam para decidir e menor era sua predisposição em continuar a correr riscos. Ou seja, mais deliberada era a decisão de inflar e menos guiada simplesmente pela recompensa. O P1 é um componente visual e de atenção, positivo entre 100 e 150 milissegundos, que prediz se o participante continuará correndo risco na próxima rodada. Outro componente que prediz o comportamento de risco na próxima rodada é a amplitude do P300, que está relacionado ao sistema de recompensa e aprendizado, um componente positivo entre 350 a 450 milissegundos. Com relação aos resultados eletrofisiológicos, quanto maior a probabilidade do comportamento de risco na próxima rodada, maior era a amplitude do P300. A Figura 1 mostra os dados médios tipicamente observados. Gu et al (2017) discutem que quanto maior a motivação, maior a amplitude do P300 e maior será a probabilidade de risco nas próximas rodadas.
Os estudos aqui apresentados apontam para a possibilidade não somente de previsão de comportamento decisório, como também da previsão de mudança de comportamento após a aprendizagem pela experiência, por meio dos componentes cognitivos e com precisão de milissegundos. Outro fator importante nesses estudos, entre tantos outros não apresentados aqui, é a melhor compreensão dos processos mais automáticos e mais controlados envolvidos na tomada de decisão. Gu et al (2017) mostraram que um componente bem inicial, o P100 ou P1, que está relacionado ao processamento visual e atencional, já prediz decisão de risco futuro. Isso ocorre mesmo não sendo esse um componente relacionado ao processamento do valor e da magnitude da recompensa, que são processos mais tardios, como o P300. Esse último componente é sensível à magnitude da recompensa, à motivação e à novidade do estímulo (Yeung, Holroyd e Cohen, 2005; WU e ZHOU, 2009).
Novos estudos deverão ser realizados antes que esses componentes possam de fato ser utilizados como marcadores neurobiológicos do comportamento de risco, por exemplo. Na tomada de decisão social, o marcador neurobiológico da aversão à injustiça, o Medial Frontal Negativity (MFN), um componente negativo em torno de 250 milissegundos, já é consistentemente apontado em diversos estudos como estando relacionado ao comportamento de rejeitar propostas injustas no Jogo do Ultimato (Campanhã et al, 2011; Boksen and De Cremer, 2010; Yu, Hu, Zhang, 2015). Assim, a neuroeconomia e as neurociências vêm caminhando a passos largos para a previsão da tomada de decisão. Além delas, há ainda a contribuição de outra nova área, o Neuromarketing, que também vem identificando as bases neurobiológicas da decisão de compra antes mesmo do cliente decidir.
Referencial Bibliográfico
BARTHOLOW, B. D., & AMODIO, D. M. (2009). Using event-related brain potentials in social psychological research: A brief review e tutorial. In E. Harmon-Jones & J. S. Beer (Eds.), Methods in social neuroscience (pp. 198-232). New York: Guilford Press.
BOKSEM, M. A.S. e DAVID DE CREMER. Fairness Concerns Predict Medial Frontal Negativity Amplitude In Ultimatum Bargaining. Social Neuroscience, v.5, n. 1, p. 118-128, 2010.
CAMPANHÃ, C., MINATI L., FREGNI F e BOGGIO PS. Responding to Unfair Offers Made by a Friendy: Neuroelectrical Activity Changes in the Anterior Medial Prefrontal Cortex. The Journal of Neuroscience, v. 31, n. 43, p. 15569-15574, 2011.
GU, Ruolei et al. Predicting risk decisions in a modified Balloon Analogue Risk Task: Conventional and single-trial ERP analyses. Cognitive, Affective, & Behavioral Neuroscience, v. 18, n. 1, p. 99-116, 2018.
LUCK, S. J. An Introduction to the Event-Related Potential Technique. Ed. Cambridge, Massachusetts, 2005.
SAN MARTÍN, René et al. Rapid brain responses independently predict gain maximization and loss minimization during economic decision making. Journal of Neuroscience, v. 33, n. 16, p. 7011-7019, 2013.
WU, Y e ZHOU, X. The P300 e reward valence, magnitude, e expectancy in outcome evaluation. Brain Research, v. 1 2 8 6, p. 1 1 4 – 1 2 2, 2009.
YU, Rongjun; HU, Pan; ZHANG, Ping. Social distance and anonymity modulate fairness consideration: An ERP study. Scientific reports, v. 5, p. 13452, 2015.
YEUNG, N; HOLROYD, CB e COHEN, JD. ERP Correlates of Feedback e Reward Processing in the Presence e Absence of Response.Choice. Cerebral Cortex, v. 15, p. 535—544, 2005.