Contributi dissociati dei recettori D1 e D2 prefrontali ai processi decisionali basati sul rischio (2011)

J Neurosci. 2011 Jun 8; 31 (23): 8625-33.

St Onge JR, Abhari H, Floresco SB.

Fonte

Dipartimento di Psicologia e Brain Research Centre, Università della British Columbia, Vancouver, Columbia Britannica V6T 1Z4, Canada

Astratto

Le scelte tra certi e incerti premi di diverse grandezze sono state proposte per essere mediate sia dai lobi frontali che dal sistema di dopamina (DA) mesocorticolimbico. Nei ratti, manipolazioni sistemiche dell'attività di DA o inattivazione della corteccia prefrontale mediale (PFC) interrompono il processo decisionale su rischi e benefici. Tuttavia, non è chiaro come la trasmissione DA PFC contribuisca a questi processi. Abbiamo affrontato questo problema esaminando gli effetti delle manipolazioni farmacologiche dei recettori D1 e D2 nel PFC mediale (prelimbico) sulla scelta tra ricompense piccole, certe e grandi, ma probabilistiche. I ratti sono stati addestrati su un compito di sconto probabilistico in cui una leva erogava un pellet con probabilità 100%, e l'altro erogava quattro granuli, ma la probabilità di ricevere ricompensa diminuiva attraverso blocchi di prove (100, 50, 25, 12.5%). Il blocco D1 (SCH23390) nella PFC mediale ha diminuito la preferenza per l'opzione grande / rischiosa. Al contrario, il blocco D2 (eticlopride) ha ridotto lo sconto probabilistico e aumentato la scelta rischiosa. L'agonista D1 SKF81297 ha causato un leggero aumento non significativo della preferenza per la leva grande / rischiosa. Tuttavia, la stimolazione del recettore D2 (quinpirolo) ha indotto un vero deficit nel processo decisionale, appiattendo la curva di sconto e la scelta di differenziazione lontano o verso l'opzione rischiosa quando era più o meno vantaggiosa, rispettivamente. Questi risultati suggeriscono che i recettori PFC D1 e D2 forniscono contributi dissociabili, ma complementari, ai giudizi di rischio / ricompensa. Colpendo un fine equilibrio tra l'attività dei recettori D1 / D2, la DA può aiutare a raffinare questi giudizi, promuovendo sia lo sfruttamento delle attuali circostanze favorevoli sia l'esplorazione di quelli più proficui quando le condizioni cambiano.

Introduzione

Le aberrazioni del sistema mesocorticolimbico della dopamina (DA) sono state collegate a profondi deficit nel processo decisionale associati a determinate malattie psichiatriche. Questi includono individui con schizofrenia (Hutton et al., 2002), morbo di Parkinson (Pagonabarraga et al., 2007) e dipendenza da stimolanti (Rogers et al., 1999). I modelli animali del processo decisionale hanno rivelato che le manipolazioni della trasmissione DA possono alterare profondamente le scelte tra ricompense piccole e facili da ottenere e ricompense grandi, ma più costose. Il blocco sistemico dei recettori D1 o D2 riduce la preferenza di aspettare più a lungo o lavorare di più per ottenere una ricompensa maggiore, mentre l'aumento della trasmissione DA esercita effetti differenziali sul processo decisionale basato sullo sforzo o sul ritardo, aumentando o diminuendo la preferenza per ricompense maggiori che derivano da un costo maggiore (Cousins et al., 1994; Cardinal et al., 2000; Denk et al., 2005; van Gaalen et al., 2006; Floresco et al., 2008a; Bardgett et al., 2009). Allo stesso modo, quando i ratti scelgono tra ricompense piccole, certe e grandi, ma rischiose in un compito di sconto probabilistico, la somministrazione sistemica di antagonisti D1 o D2 riduce la preferenza per opzioni grandi e rischiose (St. Onge e Floresco, 2009). Viceversa, gli agonisti D1 o D2 prediligono la scelta verso opzioni ampie e rischiose. Tuttavia, dato che numerose regioni del cervello sono state implicate nei giudizi di rischio / ricompensa (es. Lobi frontali, striato ventrale, amigdala) (Floresco et al., 2008b), le regioni terminali sulle quali la DA potrebbe agire per influenzare questi processi rimane poco chiara .

DA modula molteplici funzioni cognitive mediate da diverse regioni della corteccia prefrontale (PFC), come flessibilità comportamentale, memoria di lavoro e processi attenzionali (Williams e Goldman-Rakic, 1995; Granon et al., 2000; Chudasama e Robbins, 2004; Floresco et al., 2006), spesso in una curva a forma di "U rovesciata", dove un'attività troppo poco o troppo DA danneggia alcune funzioni esecutive. Tuttavia, ci sono stati relativamente pochi studi che hanno esaminato il contributo della trasmissione di DA PFC a diverse forme di processo decisionale costi / benefici. Ridurre l'attività di DA nel cingolo anteriore altera le decisioni basate sullo sforzo (Schweimer et al., 2005; Schweimer e Hauber, 2006), mentre il blocco o la stimolazione dei recettori mediani PFC D1 riduce la preferenza per ricompense maggiori e ritardate (Loos et al., 2010 ). In particolare, non sono stati condotti studi per studiare il contributo di diversi recettori PFC DA a decisioni basate sul rischio.

Il lavoro recente ha identificato la PFC mediale prelimbica come una regione critica nella mediazione dello sconto probabilistico, mentre l'attività in altre sottoregioni (cingolato anteriore, orbitofrontale, insulare) non sembra contribuire a questo comportamento (St. Onge e Floresco, 2010). L'inattivazione della PFC mediale aumentava la preferenza per ricompense più grandi e probabilistiche quando le probabilità di ottenerle diminuivano nel corso di una sessione, ma diminuivano la scelta quando le probabilità di ricompensa aumentavano nel corso di una sessione. I risultati di questo studio ci hanno portato a concludere che la PFC mediale serve per integrare le informazioni sulla modifica delle probabilità di ricompensa per aggiornare le rappresentazioni del valore che facilitano un processo decisionale più efficiente. Dato il ruolo critico che il DA mesocorticale gioca in altre forme di cognizione (Floresco e Magyar, 2006), il presente studio ha studiato il contributo dell'attività del recettore DXfrontX / D1 prefrontale al processo decisionale basato sul rischio utilizzando un compito di sconto probabilistico.

Materiali e Metodi

Animali.

Per l'esperimento sono stati utilizzati ratti maschi Long-Evans (Charles River Laboratories) del peso di 275-300 g all'inizio dell'addestramento comportamentale. All'arrivo, ai ratti è stata concessa 1 settimana per acclimatarsi alla colonia e il cibo è stato limitato all'85-90% del loro peso durante l'alimentazione libera per un'ulteriore settimana prima dell'addestramento comportamentale. Ai ratti è stato dato accesso ad libitum all'acqua per tutta la durata dell'esperimento. L'alimentazione è avvenuta nelle gabbie domestiche dei ratti alla fine della giornata sperimentale e il peso corporeo è stato monitorato quotidianamente per garantire una perdita di peso costante durante la restrizione e il mantenimento del cibo o l'aumento di peso per il resto dell'esperimento. Tutti i test erano in accordo con il Canadian Council of Animal Care e il Animal Care Committee della University of British Columbia.

Apparato.

I test comportamentali sono stati condotti nelle camere operanti 12 (30.5 × 24 × 21 cm; Med Associates) racchiuse in scatole insonorizzate, ciascuna dotata di una ventola per fornire ventilazione e per mascherare il rumore estraneo. Ciascuna camera era dotata di due leve retrattili, una situata su ciascun lato di un contenitore di cibo centrale in cui il rinforzo alimentare (45 mg; Bio-Serv) veniva erogato tramite un erogatore di pellet. Le camere sono state illuminate da una singola luce 100 mA situata nella parte superiore centrale della parete di fronte alle leve. Quattro fotocellule a infrarossi sono state montate sui lati di ciascuna camera. L'attività locomotoria è stata indicizzata dal numero di interruzioni di foto che si sono verificate durante una sessione. Tutti i dati sperimentali sono stati registrati da un personal computer IBM collegato alle camere tramite un'interfaccia.

Allenamento a leva.

I nostri protocolli di addestramento iniziale erano identici a quelli di St. Onge e Floresco (2009), adattato dal Cardinal et al. (2000). Il giorno prima della loro prima esposizione alle camere, ai ratti sono stati dati dei pellet di ricompensa di zucchero ~25 nella loro gabbia di casa. Il primo giorno di allenamento, i pellet 2-3 sono stati consegnati nella tazza del cibo e le palline tritate sono state poste su una leva prima che l'animale fosse collocato nella camera. I ratti sono stati addestrati in base a un programma 1 a rapporto fisso su un criterio delle presse 60 in 30 min, prima per una leva, e poi ripetuti per l'altra leva (contrappesi a sinistra / destra tra i soggetti). I topi sono stati quindi addestrati su una versione semplificata del compito completo. Queste sessioni di prova di 90 sono iniziate con le leve ritratte e la camera operante nell'oscurità. Ogni 40 s, un processo è stato avviato con l'illuminazione della luce della casa e l'inserimento di una delle due leve nella camera. Se il ratto non ha risposto alla leva all'interno di 10 s, la leva è stata ritirata, la camera oscurata e il processo è stato valutato come un'omissione. Se il topo ha risposto entro 10 s, la leva si è ritratta e un singolo pellet è stato consegnato con probabilità 50%. Questa procedura è stata utilizzata per familiarizzare i ratti con la natura probabilistica del compito completo. In ogni coppia di prove, la leva sinistra o destra è stata presentata una volta e l'ordine all'interno della coppia di prove era casuale. I ratti sono stati addestrati per ~5-6 d ad un criterio di 80 o più studi di successo (cioè omissioni di ≤10).

Compito di sconto probabilistico.

Il compito principale utilizzato in questi studi è stato descritto in precedenza (Floresco e Whelan, 2009; Ghods-Sharifi et al., 2009; St. Onge e Floresco, 2009, 2010; St. Onge et al., 2010), e fu originariamente modificato da quello descritto da Cardinal e Howes (2005) (Fig. 1). In breve, i ratti hanno ricevuto sessioni giornaliere costituite da studi 72, separati in blocchi 4 di studi 18. L'intera sessione ha richiesto 48 min per il completamento e gli animali sono stati addestrati 6-7 alla settimana. Una sessione è iniziata nell'oscurità con entrambe le leve ritratte (lo stato intertriale). Una prova ha iniziato ogni 40 s con l'illuminazione della luce della casa e, 3 s più tardi, l'inserimento di una o di entrambe le leve nella camera (il formato di una singola prova è mostrato in Fig. 1). Una leva è stata designata la leva grande / rischiosa, l'altra la leva piccola / sicura, che è rimasta costante durante l'allenamento (controbilanciato sinistra / destra). Se il ratto non ha risposto premendo una leva all'interno di 10 s della presentazione della leva, la camera è stata ripristinata allo stato intertriale fino alla successiva prova (omissione). Quando è stata scelta una leva, entrambe le leve si sono ritirate. La scelta della leva piccola / certa ha sempre consegnato un pellet con probabilità 100%; la scelta della leva grande / rischiosa ha fornito pellet 4 ma con una particolare probabilità. Quando il cibo è stato consegnato, la luce della casa è rimasta accesa per un altro 4 dopo che è stata fatta una risposta, dopo di che la camera è ritornata allo stato intertriale. Diverse pellet sono state consegnate a parte 0.5. I blocchi 4 erano composti da studi 8 a scelta forzata in cui veniva presentata una sola leva (studi 4 per ogni leva, randomizzati a coppie), consentendo agli animali di conoscere la probabilità relativa di ricevere la ricompensa più grande o più piccola in ogni blocco. Questo è stato seguito da prove 10 a libera scelta, in cui sono state presentate entrambe le leve e l'animale ha scelto la leva piccola / sicura o grande / rischiosa. La probabilità di ottenere pellet 4 dopo aver premuto la leva grande / rischiosa variava attraverso i blocchi: inizialmente era 100%, poi 50%, 25% e 12.5%, rispettivamente, per ciascun blocco successivo. La probabilità di ricevere la grande ricompensa in ogni prova è stata ricavata da una distribuzione di probabilità stabilita. Usando queste probabilità, la selezione della leva grande / rischiosa sarebbe vantaggiosa nei primi due blocchi e svantaggiosa nell'ultimo blocco, mentre i ratti potrebbero ottenere un numero equivalente di pastiglie alimentari dopo aver risposto su entrambe le leve durante il blocco 25%. Pertanto, negli ultimi tre blocchi di prova di questo compito, la selezione dell'opzione di ricompensa più ampia comporta un "rischio" intrinseco di non ottenere alcun compenso in un determinato processo. Sono state registrate anche le latenze per avviare una scelta e l'attività locomotoria complessiva (interruzioni di foto). I ratti sono stati addestrati sull'attività fino a quando, come gruppo, essi (1) hanno scelto la leva grande / rischiosa durante il primo blocco di prova (probabilità 100%) su almeno 80% di studi di successo e (2) hanno dimostrato livelli di base stabili di scelta, valutata utilizzando una procedura simile a quella descritta da Winstanley et al. (2005) e St. Onge e Floresco (2009). In breve, i dati di tre sedute consecutive sono stati analizzati con ANOVA a misure ripetute con due fattori interni (blocco di giorno e di prova). Se l'effetto del blocco era significativo al livello p < 0.05 ma non c'era alcun effetto principale dell'interazione del blocco giorno o giorno × prova (al livello p > 0.1), si riteneva che gli animali avessero raggiunto livelli di base stabili di comportamento di scelta.

Immagine 1.

Task design. Eventuali costi / benefici associati alla risposta su entrambe le leve (A) e il formato di una singola prova a scelta libera (B) sul compito di attualizzazione probabilistica.

Compito di discriminazione di magnitudo di ricompensa.

Come abbiamo fatto in precedenza (Ghods-Sharifi et al., 2009; Stopper e Floresco, 2011), abbiamo determinato a priori che se un particolare trattamento riduceva in modo specifico la preferenza per la leva grande / rischiosa sul compito di attualizzazione probabilistica, gruppi separati di animali verrebbero addestrati e testati su un compito di discriminazione della magnitudo di ricompensa per determinare se questo effetto fosse dovuto a una menomazione nella discriminazione tra le magnitudo di ricompensa associate alle due leve. In questi esperimenti, i ratti sono stati addestrati a premere leve retrattili come nel compito di sconto probabilistico, dopo di che sono stati addestrati sul compito di discriminazione. Qui, i ratti scelsero tra una leva che forniva una pallina e un'altra che forniva quattro granuli. Sia i piccoli che i grandi premi sono stati consegnati immediatamente dopo una singola risposta con probabilità 100%. Una sessione consisteva in quattro blocchi di prove, ognuno dei quali consisteva nella scelta forzata 2 seguita da prove 10 a scelta libera.

Chirurgia.

I ratti sono stati sottoposti a intervento chirurgico una volta che il gruppo ha mostrato modelli di scelta stabili per 3 giorni consecutivi. Dopo che il criterio di stabilità è stato raggiunto, i ratti sono stati forniti ad libitum e, 2 d, sono stati sottoposti a chirurgia stereotassica. I ratti sono stati anestetizzati con 100 mg / kg ketamina cloridrato e 7 mg / kg xilazina e successivamente impiantati con cannule guida bilaterali in acciaio inossidabile 23 nella regione prelimbica della PFC mediale (cranio piatto, anteroposteriore, + 3.4 mm; mediale-laterale, ± 0.7 mm da bregma e dorsoventrale, -2.8 mm da dura). Gli obdurator di trenta gauge, a filo con l'estremità delle cannule di guida, rimasero al loro posto fino a quando non furono fatte le infusioni. Ai ratti è stato dato almeno 7 da recuperare prima dell'intervento. Durante questo periodo di recupero, gli animali sono stati manipolati per almeno 5 min ogni giorno e il cibo era limitato al 85% del loro peso di alimentazione libera. I pesi corporei sono stati costantemente monitorati su base giornaliera per garantire una perdita di peso costante durante questo periodo di recupero.

Protocollo microinfusione

Dopo il recupero dall'intervento chirurgico, i ratti sono stati successivamente riqualificati sul compito di discriminazione probabilistica di sconto o di ricompensa per almeno 5 e fino a quando, come gruppo, hanno mostrato livelli stabili di comportamento di scelta. Per 3 d prima del primo giorno di test di microinfusione, gli obdurator sono stati rimossi e una procedura di infusione simulata è stata somministrata. Gli iniettori in acciaio inossidabile sono stati posizionati nelle cannule di guida per 2 min, ma non è stata effettuata alcuna infusione. Questa procedura ha abituato i ratti alla routine delle infusioni per ridurre lo stress nei giorni di test successivi. Il giorno dopo aver mostrato uno sconto stabile, il gruppo ha ricevuto il suo primo giorno di test per microinfusione.

Per tutti gli esperimenti è stato utilizzato un design all'interno dei soggetti. Sono stati usati i seguenti farmaci: l'antagonista D1 R - (+) - SCH23390 cloridrato (1.0 μg, 0.1 μg; Sigma-Aldrich), l'antagonista D2 eticlopride cloridrato (1.0 μg, 0.1 μg; Sigma-Aldrich), l'agonista del recettore D1 SKF81297 (0.4 μg, 0.1 μg; Tocris Bioscience) e l'agonista D2 quinpirolo (10 μg, 1 μg; Sigma-Aldrich). Tutti i farmaci sono stati disciolti in soluzione fisiologica 0.9%, sonicata fino alla dissoluzione e protetta dalla luce. Le dosi selezionate sono state ben documentate sia dal nostro gruppo che da altri come comportamentali attivi quando somministrati intracerebralmente (Seamans et al., 1998; Ragozzino, 2002; Chudasama e Robbins, 2004; Floresco e Magyar, 2006; Floresco et al., 2006; Haluk e Floresco, 2009; Loos et al., 2010).

Le infusioni degli antagonisti D1 e D2, degli agonisti e della soluzione salina sono state somministrate bilateralmente nella PFC mediale tramite una pompa a microsiringa collegata a tubi in PE e cannule a gauge 30 che sporgevano 0.8 mm oltre la fine della guida, ad una velocità di 0.5 μl / 75 S. Le cannule di iniezione sono state lasciate sul posto per un ulteriore 1 min per consentire la diffusione. Ogni topo è rimasto nella sua gabbia di casa per un altro periodo di 10 min prima dei test comportamentali.

Quattro gruppi separati di ratti sono stati utilizzati per testare gli effetti di ciascuno dei quattro composti (antagonista D1, antagonista D2, agonista D1, agonista D2). L'ordine dei trattamenti (soluzione salina, dose bassa, dose alta) è stata controbilanciata tra i ratti all'interno di un particolare gruppo di trattamento. Dopo il primo giorno del test di infusione, i ratti hanno ricevuto una giornata di addestramento di base (senza infusione). Se, per ogni singolo ratto, la scelta della leva grande / rischiosa in questo giorno deviava di> 15% dalla sua linea di base preinfusione, il ratto ha ricevuto un giorno aggiuntivo di addestramento prima del secondo test di infusione. Il giorno successivo, i ratti hanno ricevuto una seconda infusione controbilanciata, seguita da un altro giorno di riferimento e infine dall'ultima infusione.

Istologia.

Dopo il completamento di tutti i test comportamentali, i ratti sono stati uccisi in una camera di biossido di carbonio. I cervelli sono stati rimossi e fissati in una soluzione di formalina 4%. I cervelli sono stati congelati e tagliati in sezioni 50 μm prima di essere montati e macchiati con cresyl violet. I posizionamenti sono stati verificati con riferimento all'atlante neuroanatomico di Paxinos e Watson (1998). Le posizioni delle infusioni accettabili nella PFC mediale sono presentate nei pannelli di destra della Figura 2.

Immagine 2.

Istologia. Schema di sezioni coronali del cervello di ratto che mostrano la gamma di posizioni accettabili di infusioni attraverso l'estensione rostrale-caudale della PFC mediale per tutti i ratti.

Analisi dei dati.

La principale misura di interesse dipendente era la percentuale di scelte dirette verso la leva grande / rischiosa per ciascun blocco di studi a scelta libera, tenendo conto delle omissioni di prova. Per ogni blocco, questo è stato calcolato dividendo il numero di scelte della leva grande / rischiosa per il numero totale di prove riuscite. I dati di scelta per ciascun gruppo di farmaci sono stati analizzati utilizzando ANOVA a due vie all'interno del soggetto, con trattamento (soluzione salina, dose bassa, dose alta) e blocco di prova (100, 50, 25, 12.5%) come fattori all'interno del soggetto. L'effetto principale del blocco per i dati di scelta è stato significativo in tutti gli esperimenti di sconto (p <0.05), indicando che i ratti hanno scontato la scelta della leva grande / rischiosa poiché la probabilità della grande ricompensa cambiava nei quattro blocchi. Questo effetto non verrà ulteriormente menzionato. Le latenze di risposta, l'attività locomotoria (interruzioni del fascio di luce) e il numero di omissioni di prova sono state analizzate con ANOVA unidirezionali.

Sezione precedente Sezione successiva

Risultati

Quattro gruppi di animali sono stati inizialmente addestrati in esperimenti separati e assegnati a uno dei quattro gruppi di farmaci. I primi due gruppi di 16 ciascuno, designati per gli esperimenti di antagonista D1 e D2, hanno richiesto una media di 28 di allenamento prima di raggiungere prestazioni di scelta stabili e ricevere test di microinfusione controbilanciati. I secondi due gruppi di ratti 14 e 14 per gli agonisti D1 e D2 hanno richiesto una media di 34 di allenamento prima di raggiungere prestazioni di scelta stabili. I dati di latenza di risposta, locomotore e omissione di prova ottenuti nei giorni di test per tutti e quattro i gruppi sono presentati nella Tabella 1.

Tabella 1.

Locomozione, omissione di prova e dati di risposta latenza ottenuti dopo infusione di soluzione salina o di droga nella PFC mediale

D1 e D2 antagonismo del recettore e sconto probabilistico

Blocco D1

Inizialmente, 16 ratti sono stati addestrati per questo esperimento. Un animale è morto durante l'intervento chirurgico e i dati di altri tre sono stati eliminati a causa di posizionamenti imprecisi, con un risultato finale n = 12. L'analisi dei dati scelti ha rivelato che le infusioni intra-PFC dell'antagonista D1 SCH23390 hanno determinato un effetto principale significativo del trattamento (F (2,22) = 3.26, p = 0.05) ma nessun trattamento × interazione del blocco (F (6,66) = 0.92, ns). La dose elevata di SCH23390 (1 μg) ha ridotto significativamente la preferenza per la leva grande / rischiosa negli ultimi tre blocchi (p <0.05; Fig. 3A), mentre la dose bassa (0.1 μg) non ha prodotto alcun cambiamento affidabile nel comportamento di scelta. Il blocco D1 non ha avuto effetto sulle latenze di risposta (F (2,22) = 0.18, ns), omissioni di prova (F (2,22) = 0.54, ns) o conteggi locomotori (F (2,22) = 1.66, ns ).

Immagine 3.

Effetti delle manipolazioni del recettore DA nella PFC mediale sullo sconto probabilistico. I dati vengono tracciati in termini di scelta percentuale della leva grande / rischiosa durante le prove a scelta libera per blocco di probabilità (asse x). I simboli rappresentano media + SEM. Le stelle grigie denotano un effetto principale significativo (soluzione salina vs dose elevata, p <0.05). Le stelle nere indicano una differenza significativa (p <0.05) tra le condizioni di trattamento durante un particolare effetto principale del blocco di probabilità. A, Le infusioni della dose di 1.0 μg di antagonista D1 SCH23390 hanno accelerato lo sconto probabilistico, riducendo la scelta rischiosa. B, Al contrario, le infusioni della dose di 1.0 μg dell'antagonista D2 eticlopride hanno ritardato lo sconto e aumentato la scelta rischiosa. C, L'agonista D1 SKF81297 ha indotto un leggero, non significativo aumento nella scelta rischiosa. D, Le infusioni della dose da 10 μg del chinpirolo agonista D2 hanno abolito lo sconto, diminuendo la scelta rischiosa durante il blocco iniziale e aumentando la scelta durante il blocco finale.

Blocco D2

Inizialmente, 16 ratti sono stati addestrati per questo esperimento. Un animale è morto durante l'intervento chirurgico e i dati di altri tre sono stati eliminati a causa di posizionamenti imprecisi, con un risultato finale n = 12. L'analisi dei dati scelti ha anche rivelato un effetto principale significativo del trattamento (F (2,22) = 3.76, p <0.05) ma nessun trattamento × interazione del blocco (F (6,66) = 0.84, ns). Tuttavia, in contrasto con gli effetti del blocco del recettore D1, la dose elevata di eticlopride (1 μg) ha aumentato significativamente la preferenza per la leva grande / rischiosa su tutti i blocchi (p <0.05; Fig. 3B), con la dose bassa (0.1 μg) ) producendo un leggero, ma non significativo, aumento della scelta. Eticlopride non ha avuto effetto sulle latenze di risposta (F (2,22) = 0.63, ns), omissioni di prova (F (2,22) = 1.45, ns) o conte locomotorie (F (2,22) = 0.99, ns) . Pertanto, il blocco dei recettori D1 o D2 nella PFC mediale ha avuto effetti qualitativamente opposti sullo sconto probabilistico. La riduzione dell'attività del recettore D1 ha aumentato lo sconto di ricompense più grandi e incerte, mentre l'antagonismo del recettore D2 ha ridotto lo sconto, riflesso rispettivamente come apparenti diminuzioni e aumenti nella scelta rischiosa.

Stimolazione del recettore D1 e D2 e sconto probabilistico

Stimolazione D1

Inizialmente, i ratti 14 sono stati addestrati per questo esperimento. Un animale è morto durante un intervento chirurgico e i dati di un ratto sono stati esclusi perché i suoi dati di base di riferimento erano 2 SD al di sotto della media del resto del gruppo, risultando in un n = 12 finale. In seguito alla somministrazione dell'agonista D1 SKF81297 nella PFC mediale, i ratti tendevano a mostrare un effetto opposto a quello indotto dall'antagonista D1, mostrando un moderato aumento della preferenza per la leva grande / rischiosa, con questo effetto numericamente maggiore dopo il trattamento con dose inferiore, 0.1 μg. Nonostante questa tendenza, l'analisi dei dati di scelta non ha rivelato un effetto significativo del trattamento (F (2,22) = 2.05, ns) o l'interazione trattamento × blocco (F (6,66) = 0.10, ns; Fig. 3C), sebbene un diretto il confronto tra le condizioni di trattamento a basse dosi e saline ha mostrato una tendenza verso la significatività statistica (p = 0.086). L'agonista D1 non ha avuto alcun effetto sulle latenze di risposta (F (2,22) = 0.67, ns), omissioni di prova (F (2,22) = 0.06, ns) o conteggi locomotori (F (2,22) = 0.36, ns).

Stimolazione D2

Ancora una volta, 14 ratti sono stati addestrati per questo esperimento. I dati di un ratto sono stati esclusi perché i dati della sua scelta di base non hanno mostrato uno sconto evidente dopo il 34 d di addestramento, mentre i dati relativi a un altro ratto sono stati eliminati a causa di un posizionamento impreciso, risultando in un n = 12 finale in questo gruppo. Il trattamento con l'agonista D2 chinpirolo ha indotto un effetto sulla scelta che era unico rispetto a quello indotto dall'antagonista del recettore DA o dall'agonista D1. L'analisi dei dati di scelta non ha rivelato alcun effetto principale significativo del trattamento (F (2,22) = 0.05, ns), ma c'era una significativa interazione trattamento × blocco (F (6,66) = 2.33, p <0.05, p di Dunnett <0.05). Semplici analisi degli effetti principali hanno inoltre dimostrato che, mentre la dose bassa (1 μg) di quinpirolo non ha avuto effetto sulla scelta, la dose alta (10 μg) ha prodotto un marcato “appiattimento” della curva di sconto. In particolare, questa dose ha ridotto significativamente (p <0.05) la scelta della leva grande / rischiosa nel blocco iniziale del 100%, ma ha aumentato significativamente la scelta rischiosa durante l'ultimo blocco (12.5%) rispetto alle infusioni saline (Fig. 3D). Inoltre, a seguito delle infusioni di soluzione salina o della dose di 1.0 μg di quinpirolo, i ratti hanno mostrato uno sconto significativo dell'opzione grande / rischiosa poiché le probabilità di ottenere la ricompensa maggiore diminuivano nel corso di una sessione (p <0.005). Al contrario, la proporzione di scelta di questa opzione non è cambiata in modo significativo nei quattro blocchi dopo il trattamento con 10 μg di quinpirolo (p> 0.25). Il quinpirolo non ha avuto effetto sulle omissioni dello studio (F (2,22) = 0.84, ns) o sulla conta locomotoria (F (2,22) = 1.72, ns), sebbene la dose elevata abbia aumentato significativamente le latenze di scelta tra i quattro blocchi (F ( 2,22) = 3.54, p <0.05 e Dunnett's, p <0.05; Tabella 1).

Analisi Win-stay / lose-shift

Le infusioni di agonisti o antagonisti selettivi dei recettori D1 o D2 nella PFC mediale hanno ciascuno indotto effetti distinti sul processo decisionale. Per ottenere ulteriori informazioni su come questi trattamenti hanno influenzato i modelli di scelta e le conseguenti alterazioni nello sconto, abbiamo condotto un'analisi supplementare dei dati sulla scelta. Nello specifico, abbiamo condotto un'analisi scelta per scelta per identificare se i cambiamenti nel comportamento fossero dovuti ad alterazioni nella probabilità di scegliere la leva rischiosa dopo aver ottenuto la ricompensa maggiore (performance win-stay) o alterazioni nella sensibilità al feedback negativo (loss-shift performance) (Bari et al., 2009; Stopper e Floresco, 2011). Le scelte degli animali durante l'attività sono state analizzate in base al risultato di ogni precedente prova a libera scelta (premio o non premio) ed espresse come rapporto. La proporzione di prove di vittoria-soggiorno è stata calcolata dal numero di volte in cui il ratto ha scelto la leva grande / rischiosa dopo aver scelto l'opzione rischiosa nella prova precedente e aver ottenuto la grande ricompensa (una vittoria), diviso per il numero totale di libera scelta prove in cui il topo ha ottenuto la ricompensa maggiore. Al contrario, la prestazione in caso di perdita del turno è stata calcolata dal numero di volte in cui i ratti hanno spostato la scelta sulla leva piccola / certa dopo aver scelto l'opzione rischiosa nella prova precedente e non sono stati ricompensati (una perdita), diviso per il numero totale di prove a libera scelta con conseguente perdita.

A causa della natura probabilistica del compito, attraverso i quattro esperimenti ci sono state almeno istanze 4-5 in cui un singolo animale o non ha selezionato la leva grande / rischiosa (e quindi, non poteva "restare" o "spostarsi" dopo una vittoria o perdita) o non ha ottenuto la grande ricompensa per tutto un certo blocco di probabilità (in particolare gli ultimi due blocchi). Pertanto, in entrambi i casi, il denominatore nell'equazione utilizzata per calcolare questi rapporti sarebbe zero per almeno uno dei blocchi, il che ci precludeva dal condurre un'analisi di blocco di questi dati. Per superare questo, è stata condotta un'analisi per tutte le prove attraverso i quattro blocchi, come abbiamo fatto in precedenza (Stopper e Floresco, 2011). I cambiamenti nella performance win-stay sono stati utilizzati come indice generale dell'impatto che l'ottenimento della grande remunerazione rischiosa ha avuto sul comportamento di scelta successivo, mentre i cambiamenti nelle prestazioni di perdere-turno hanno rappresentato un indice di sensibilità al feedback negativo per l'intera durata del test sessione.

Dato che ciascuno dei quattro composti induceva effetti distinti sul comportamento di scelta, eravamo particolarmente interessati a confrontare direttamente gli effetti di ciascun composto rispetto al trattamento con soluzione salina. Per questa analisi, abbiamo utilizzato i dati ottenuti dopo il trattamento con le dosi più efficaci di ciascun farmaco e le corrispondenti iniezioni di veicoli (per SKF81297, abbiamo utilizzato i dati ottenuti dopo il trattamento con la dose inferiore, 0.1 μg). L'analisi degli studi win-stay e loss-shift ha rivelato una significativa interazione a quattro vie del tipo di studio (win-stay vs loss-shift) × trattamento (soluzione salina vs farmaco) × recettore (D1 vs D2) × tipo di farmaco (antagonista vs agonista ) (F (1,44) = 11.92, p <0.05; Fig.4, Tabella 2). Come è stato osservato con l'analisi del comportamento di scelta generale, questa interazione a quattro vie è stata guidata dal fatto che ogni farmaco ha indotto un effetto distinto sulle tendenze di vittoria-soggiorno / perdita di turno. Per quanto riguarda la performance win-stay, in condizioni di controllo, i ratti hanno mostrato una forte tendenza (tra l'80 e il 90%) a selezionare la leva rischiosa dopo aver selezionato questa leva nella prova precedente e aver ricevuto ricompensa, come abbiamo osservato in precedenza (Stopper e Floresco , 2011). Al contrario, gli animali tendevano a spostarsi sulla leva piccola / certa a seguito di una "perdita" dopo aver scelto la leva grande / rischiosa sul ∼25-30% di queste prove in condizioni di controllo.

Immagine 4.

Effetti delle manipolazioni del recettore PFC DA sulle tendenze win-stay (barre grigie) e lose-shift (barre bianche). Per chiarezza e scopi comparativi, i dati sono presentati qui in termini di un punteggio di differenza tra i rapporti ottenuti sui trattamenti farmacologici contro quelli salini (i valori positivi indicano un rapporto aumentato, valori negativi una diminuzione dopo il trattamento farmacologico relativo alle infusioni di controllo). I dati grezzi utilizzati nell'analisi complessiva da cui sono stati ottenuti questi valori sono presentati nella Tabella 2. I rapporti vincente indicano la proporzione di prove per le quali i ratti hanno scelto la leva grande / rischiosa dopo aver ricevuto la ricompensa più grande nella prova precedente. Le percentuali di perdita di grasso indicano la proporzione di prove per le quali i ratti hanno spostato la scelta alla leva piccola / sicura in seguito alla scelta non ricompensata della leva grande / rischiosa. Le stelle denotano una differenza significativa rispetto alla soluzione salina a livello 0.05. ns, non significativo.

Tabella 2.

Rapporti win-stay / lose-shift per ratti che eseguono il compito di attualizzazione probabilistica dopo infusione di soluzione salina e la dose più alta o più efficace di D1 e D2 antagonisti o agonisti

Una semplice analisi degli effetti principali dell'interazione a quattro vie ha rivelato che l'antagonista D1 SCH23390 non ha influenzato le prestazioni win-stay ma ha aumentato significativamente le tendenze di perdita di turno (Dunnett, p <0.05), suggerendo che la diminuzione della scelta rischiosa indotta da questi trattamenti può essere attribuibile in parte a una maggiore sensibilità al feedback negativo (cioè; omissione di ricompensa). Al contrario, il blocco D2 con eticlopride (1 μg) ha aumentato significativamente la probabilità di scegliere l'opzione rischiosa a seguito di una "vittoria" (p <0.05), provocando una diminuzione non significativa delle tendenze a perdere il turno. Pertanto, l'aumento della scelta rischiosa indotto dal blocco D2 sembra essere attribuibile principalmente a un maggiore impatto dell'ottenimento di una grande ricompensa sulla scelta successiva.

L'agonista D1 SKF81297 (0.1 μg) ha aumentato significativamente le prestazioni di win-stay rispetto alla soluzione salina (p <0.05), ma ha anche avuto l'effetto opposto di SCH23390, riducendo la tendenza a spostarsi dopo una perdita dalla leva grande / rischiosa (p <0.05) . Al contrario, il quinpirolo (10 μg) ha avuto l'effetto opposto dell'agonista D1 sulle tendenze win-stay, diminuendo significativamente la probabilità di scegliere la leva grande / rischiosa dopo una "vittoria" (p <0.05), suggerendo una ridotta sensibilità al ricevimento di ricompense più grandi, ma incerte. Questo trattamento non ha avuto effetti significativi sui rapporti di perdita-soggiorno. Questi risultati indicano che la modulazione del recettore D1 vs D2 induce cambiamenti differenziali nelle prestazioni di scelta che sembrano essere caratterizzati da cambiamenti distinti nell'impatto dell'ottenimento della maggiore ricompensa o della sensibilità al feedback negativo.

Discriminazione della magnitudine di ricompensa

Il blocco dei recettori D1 o la stimolazione dei recettori D2 ha ridotto la preferenza per la ricompensa più ampia e incerta durante alcuni blocchi di prova del compito di attualizzazione. Per valutare se questi effetti fossero attribuibili a una rottura generale nella discriminazione tra i premi di diverse grandezze, abbiamo condotto un altro esperimento, in cui due gruppi separati di ratti sono stati addestrati su un compito più semplice. I ratti hanno scelto tra due leve che erogavano uno o quattro granuli, entrambi con probabilità 100%. Quindici ratti sono stati addestrati per 11 d su questo compito prima di ricevere microinfusioni controbilanciate della dose elevata di SCH23390 (1 μg) o quinpirolo (10 μg) e soluzione salina. I dati relativi a un animale sono stati rimossi a causa di un posizionamento impreciso, lasciando un n finale di 6 nel gruppo SCH23390 e 8 nel gruppo quinpirole.

Blocco D1

Dopo le infusioni saline, i ratti hanno mostrato un forte pregiudizio verso la ricompensa maggiore, selezionando questa opzione in quasi il 100% delle prove (Fig. 5A). Dopo le infusioni di SCH23390 (1 μg), non vi è stato alcun cambiamento nella preferenza verso l'opzione a quattro pellet (F (1,5) = 1.72, ns). In contrasto con la scelta, abbiamo visto un leggero aumento delle latenze di risposta a seguito del blocco D1 (soluzione salina = 0.81 ± 0.1 s, SCH23390 = 0.98 ± 0.1 s; F (1,5) = 7.18, p <0.05). L'attività locomotoria (F (1,5) = 4.86, ns) e le omissioni di prova (F (1,5) = 1.0, ns) non sono state influenzate da SCH23390. Pertanto, anche se le infusioni di questa dose di SCH23390 hanno ridotto la scelta dell'opzione di ricompensa più ampia durante l'attività di attualizzazione probabilistica, questo effetto non sembra essere attribuibile a una riduzione generale del valore soggettivo di ricompense maggiori.

Immagine 5.

Effetti della modulazione del recettore DA nel PFC mediale sulla discriminazione della magnitudo di ricompensa. I ratti sono stati addestrati a scegliere tra due leve che consegnavano una ricompensa di quattro o un pellet immediatamente dopo una singola pressa con probabilità 100%. A, il blocco D1 (SCH23390, 1 μg) non ha alterato in modo significativo la preferenza per la ricompensa di quattro pellet più ampia durante gli studi a scelta libera relativi al trattamento con soluzione salina. B, la stimolazione del recettore D2 (quinpirolo, 10 μg) non ha alterato la preferenza per la grande ricompensa.

Stimolazione del recettore D2

Un profilo di scelta simile è stato osservato per i ratti che hanno ricevuto la dose elevata (10 μg) di chinpirolo nella PFC mediale. Ancora una volta, i ratti hanno selezionato l'opzione a quattro pallini su quasi tutti gli studi a scelta libera dopo le infusioni saline. Questa preferenza non è stata alterata dalla stimolazione dei recettori D2 (F (1,6) = 0.53, ns; Fig. 5B). Il quinpirolo inoltre non ha avuto effetti significativi su latenze, locomozione o omissioni (tutti i valori F <1.76, ns). Si noti che trattamenti simili hanno ridotto la scelta della ricompensa maggiore per l'attività di sconto probabilistico durante il primo blocco di probabilità del 100% (Fig. 3B). Una possibile spiegazione di questa differenza è che, a differenza dei ratti addestrati alla discriminazione dell'entità della ricompensa, quelli addestrati al compito di attualizzazione avevano imparato che l'utilità relativa dell'opzione grande / rischiosa diminuisce nel corso di una sessione. Pertanto, la loro rappresentazione del valore relativo dell'opzione di grande ricompensa dovrebbe essere più labile di quella dei ratti addestrati al compito più semplice e, quindi, più suscettibili di interruzione. Collettivamente, i risultati di questo esperimento mostrano che anche se il blocco dei recettori D1 e la stimolazione dei recettori D2 alterano sostanzialmente le scelte tra ricompense probabilistiche piccole, certe e grandi, questi effetti non sembrano essere attribuibili a menomazioni più fondamentali nella capacità di discriminare tra ricompense più grandi e più piccole.

Discussione

Qui riportiamo che i recettori D1 e D2 nella PFC mediale esercitano un'influenza critica sulle scelte tra i probabilistici rispetto a determinati premi. Inoltre, l'attività decrescente o crescente di ciascuno di questi recettori ha prodotto cambiamenti, a volte opposti, nella scelta, suggerendo che ciascuno di essi esercita un controllo modulatorio distinto ma complementare rispetto a questi processi decisionali.

Effetti del blocco del recettore D1 / D2

A nostra conoscenza, questa è la prima dimostrazione che il blocco del recettore D1 o D2 nella PFC mediale induce effetti opposti sul comportamento. Studi precedenti di questo tipo hanno rivelato che D1, ma non D2, l'antagonismo interrompe funzioni come l'attenzione o la memoria di lavoro (Williams e Goldman-Rakic, 1995; Seamans e altri, 1998; Granon et al., 2000) o che entrambi i recettori agiscono in modo cooperativo per facilitare il comportamento di set-shifting o bias lontano dai punitori condizionati (Ragozzino, 2002; Floresco e Magyar, 2006). Le nostre scoperte che SCH23390 ed eticlopride hanno indotto effetti opposti sulla scelta suggeriscono che il normale processo decisionale dipende da un equilibrio critico tra l'attività del recettore D1 e D2 del lobo frontale e che l'alterazione di questo equilibrio induce cambiamenti dissociabili nella scelta di premi certi / incerti.

Il blocco PFC D1 ha diminuito la preferenza per l'opzione grande / rischiosa in modo dose-dipendente, il più prominente durante gli ultimi tre blocchi di probabilità. SCH23390 ha aumentato lo sconto probabilistico, simile agli effetti di questo composto quando somministrato sistemicamente (St. Onge e Floresco, 2009). È interessante notare come la riduzione della trasmissione di DA in soggetti umani attraverso l'esaurimento della tirosina porti anche a un processo decisionale più conservativo e di qualità inferiore sul Cambridge Gambling Task (McLean et al., 2004). I nostri risultati suggeriscono che questi effetti possono essere mediati in parte dalla ridotta attivazione prefrontale di D1. L'analisi scelta per scelta ha inoltre rivelato che questa preferenza ridotta per l'opzione rischiosa era legata alla crescente tendenza a scegliere l'opzione piccola / sicura in base a una scelta rischiosa non premiata, suggerendo che gli effetti sul processo decisionale potrebbero essere il risultato di un aumento sensibilità al feedback negativo. In una vena simile, il blocco dei recettori D1 nel cingolato prelimbico o anteriore riduce la preferenza per i premi più grandi quando sono ritardati (Loos et al., 2010) o associati a un costo maggiore (Schweimer e Hauber, 2006). Collettivamente, questi risultati suggeriscono che la segnalazione di PFC D1 esercita un'influenza profonda sulle valutazioni costi / benefici, facilitando la capacità di superare i costi che possono essere associati a maggiori guadagni nel tentativo di massimizzare i guadagni a lungo termine.

In netto contrasto, il blocco del recettore PFC D2 ha aumentato la preferenza per l'opzione grande / rischiosa, rallentando lo spostamento dei pregiudizi di scelta poiché le probabilità di ricompensa sono diminuite nel corso di una sessione. In particolare, questo effetto assomiglia a quello indotto dall'inattivazione della PFC in simili condizioni operative (St. Onge e Floresco, 2010). Tuttavia, non crediamo che ciò rifletta un aumento generale del comportamento "rischioso" di per sé. Piuttosto, i nostri risultati precedenti ci hanno portato a concludere che la PFC mediale svolge un ruolo fondamentale nel monitorare i cambiamenti nelle probabilità di ricompensa per adeguare il comportamento di conseguenza. I risultati attuali si espandono su questo, rivelando che i recettori D2 forniscono un contributo essenziale alla regolazione PFC di questo aspetto del processo decisionale. Questo apparente aumento nella scelta rischiosa è stato guidato in modo più prominente da una maggiore tendenza a selezionare l'opzione rischiosa dopo aver ottenuto una grande ricompensa nella prova precedente. Quindi, piuttosto che integrare le informazioni sulla probabilità di ottenere la ricompensa più ampia attraverso più studi, il blocco D2 ha causato il ricevimento della ricompensa più ampia per esercitare un impatto più grande e più immediato sulla direzione della scelta successiva. Ciò è in linea con un recente studio sugli esseri umani, in cui l'antagonismo D2 ha aumentato sia la scelta delle opzioni associate a maggiori probabilità di ricompensa che i corrispondenti cambiamenti nell'attività della PFC ventromediale (Jocham et al., 2011). Collettivamente, questi risultati mostrano che i recettori PFC D1 e D2 formano contributi distinti ma complementari al processo decisionale. L'attività del recettore D1 promuove la scelta di ricompense più grandi, ma incerte o più costose, mentre i recettori D2 attenuano l'impatto immediato che i più grandi, premi probabilistici esercitano sui pregiudizi di scelta, facilitando la capacità di adeguare il comportamento a lungo termine quando la probabilità di ottenere questi premi i cambiamenti.

Effetti della stimolazione del recettore D1 / D2

Le infusioni intra-PFC dell'agonista del recettore D1 SKF81297, all'interno di intervalli di dosi che hanno dimostrato di esercitare effetti differenziali su altre forme di cognizione (attenzione, memoria di lavoro), non hanno alterato significativamente la scelta rischiosa, sebbene questi trattamenti abbiano leggermente aumentato la preferenza per il grande / leva rischiosa, in particolare con la dose bassa. L'interpretazione di questo effetto nullo deve essere affrontata con cautela, poiché questi effetti dose / risposta non monotonici suggeriscono che SKF81297 può avere un intervallo di dose efficace che è più stretto di quello che potrebbe essere per altre funzioni cognitive. Inoltre, la dose di 0.1 μg ha alterato in modo significativo i pattern di scelta, aumentando le performance win-stay e diminuendo le tendenze a perdere, laddove i ratti erano più propensi a scegliere la leva grande / rischiosa a seguito sia delle ricompense che delle omissioni dei premi. Tuttavia, il fatto che aumentando le dosi di SKF81297 non alterasse significativamente la scelta indica che la stimolazione sopranormale dei recettori PFC D1 non interferisce sostanzialmente con il processo decisionale su rischi e benefici. Al contrario, trattamenti simili diminuiscono la scelta di ricompense maggiori e ritardate (Loos et al., 2010), fornendo ulteriore supporto che diversi tipi di decisioni in termini di costi / benefici possono essere dissociati farmacologicamente.

Il quinpirolo agonista D2 ha indotto una vera "menomazione" nel processo decisionale, appiattendo marcatamente la curva di attualizzazione, con ratti che non mostravano alcuna discernibilità attinente ai cambiamenti nelle probabilità di ricompensa. La scelta dell'opzione a quattro pellet è stata ridotta nel blocco 100% (quando era più vantaggioso), ma aumentato nel blocco 12.5% (quando è meno vantaggioso). In seguito alla stimolazione con D2, la proporzione complessiva di scelte grandi / rischiose non è cambiata rispetto a quella salina (~73%), ma gli animali erano completamente insensibili ai cambiamenti in queste probabilità. Pertanto, un'eccessiva attivazione del recettore D2 interferiva gravemente con la capacità di regolare la scelta, apparentemente facendo sì che i ratti usassero una strategia di alternanza più semplice attraverso i blocchi mantenendo un pregiudizio verso la leva grande / rischiosa. Questo risultato, in combinazione con gli effetti dell'eticlopride, suggerisce che i livelli relativi di D2 (piuttosto che D1) tono del recettore nella PFC mediale ha un impatto critico su questo aspetto del processo decisionale, e sia l'aumento o la diminuzione di questa attività può interferire con le prestazioni.

Il modello di scelta svantaggioso prodotto da Quinpirolo ha una sorprendente somiglianza con quello indotto riducendo la motivazione per il cibo attraverso l'alimentazione a lungo termine (St. Onge e Floresco, 2009). Questi risultati complementari rendono allettante ipotizzare che possano essere fenomeni correlati. In effetti, i cambiamenti nell'efflusso di DA della PFC mediale sono stati proposti per riflettere un segnale generativo di ricompensa o incentivo motivazionale (Ahn e Phillips, 1999, Winstanley et al., 2006). Pertanto, i cambiamenti nella quantità di ricompensa ottenuta nel tempo possono essere segnalati al PFC da corrispondenti fluttuazioni nei livelli di DA mesocorticali che, attraverso azioni sui recettori D2, possono essere utilizzati per rilevare cambiamenti nella quantità di ricompensa ottenuta nel tempo e facilitare alterazioni in pregiudizio di scelta. Ne consegue che l'allagamento dei recettori D2 può interferire con questo segnale dinamico, che potrebbe alla fine produrre schemi di scelta più statici.

Contributi dissociabili dei recettori PFC D1 e D2 al processo decisionale basato sul rischio

Rimane la domanda sul perché il blocco dei recettori D1 o D2 dovrebbe esercitare effetti opposti sulla scelta rischiosa, dato che l'DA endogena attiva entrambi i recettori. La teoria contemporanea su come questi recettori influenzano in modo differenziale l'attività della rete neurale della PFC può fornire informazioni su questo problema (Durstewitz et al., 2000; Seamans e Yang, 2004). I recettori D1 sono stati proposti per ridurre l'influenza degli input deboli, stabilizzando l'attività della rete in modo che una singola rappresentazione domini l'output PFC. Viceversa, l'attività D2 attenua le influenze inibitorie, consentendo agli insiemi neurali PFC di elaborare più stimoli / rappresentazioni, ponendo queste reti in uno stato più labili che può consentire cambiamenti nelle rappresentazioni.

Durante le diverse fasi del compito di attualizzazione probabilistico usato qui, gli animali in alcuni punti devono mantenere (all'interno di un blocco di probabilità) o modificare (attraverso blocchi) la loro rappresentazione del valore relativo dell'opzione grande / rischiosa. Pertanto, gli effetti opposti dell'antagonismo D1 / D2 qui descritti possono riflettere i contributi differenziali di questi recettori durante fasi distinte dell'attività. L'attività D1 può stabilizzare la rappresentazione del valore relativo a lungo termine dell'opzione rischiosa all'interno di un determinato blocco, mantenendo il pregiudizio di scelta anche quando una scelta rischiosa porta all'omissione del premio (mantenendo "l'occhio sul premio"). Il blocco di questi recettori renderebbe gli animali più sensibili alle omissioni di ricompensa (cioè, aumentando le tendenze a perdere) e ridurrebbe la scelta rischiosa. Viceversa, poiché l'opzione grande / rischiosa produce meno ricompense tra i blocchi, i recettori D2 (probabilmente su una diversa popolazione neuronale) possono facilitare le modifiche nelle rappresentazioni del valore. Di conseguenza, la riduzione della loro attività interromperebbe l'aggiornamento di queste rappresentazioni e i corrispondenti cambiamenti di bias di scelta. Questo modello può anche in parte spiegare gli effetti dell'aumento dell'attività del recettore D1 e D2, che dovrebbe portare a una scelta più persistente dell'opzione grande / rischiosa o indurre uno stato "iperflessibile", rispettivamente. Pertanto, i nostri risultati suggeriscono che il tono DA PFC fornisce un contributo critico e complesso ai giudizi di rischio / ricompensa. Colpendo un fine equilibrio tra l'attività del recettore D1 / D2, la DA mesocorticale può aiutare a perfezionare le decisioni di costi / benefici tra opzioni di varia grandezza e incertezza, promuovendo lo sfruttamento delle attuali circostanze favorevoli o l'esplorazione di quelle più redditizie quando le condizioni cambiano.

Le note

Questo lavoro è stato supportato da una sovvenzione dal Canadian Institutes of Health Research (MOP 89861) a SBFSBF è un Michael Smith Foundation for Health Research Senior Scholar e JRSO è il destinatario di borse di studio dal Natural Research and Engineering Research Council del Canada e il Michael Fondazione Smith per la ricerca sanitaria.

La corrispondenza deve essere indirizzata al Dott. Stan B. Floresco, Dipartimento di Psicologia e Brain Research Center, Università della British Columbia, 2136 West Mall, Vancouver, BC V6T 1Z4, [email protected]

Copyright © 2011 gli autori 0270-6474 / 11 / 318625-09 $ 15.00 / 0

Referenze

1. ↵

1. Ahn S,

2. Phillips AG

(1999) Correlati dopaminergici di sazietà sensoriale specifica nella corteccia prefrontale mediale e nel nucleo accumbens del ratto. J Neurosci 19: RC29, (1-6).

Abstract / FREE Full Text

2. ↵

1. Bardgett ME,

2. Depenbrock M,

3. Downs N,

4. Punti M,

5. L verde

(2009) La dopamina modula il processo decisionale basato sugli sforzi nei ratti. Behav Neurosci 123: 242-251.

CrossRefMedline

3. ↵

1. Bari A,

2. Eagle DM,

3. Mar AC,

4. Robinson ES,

5. Robbins TW

(2009) Effetti dissociabili del blocco dell'assorbimento di noradrenalina, dopamina e serotonina sulle prestazioni del compito di arresto nei ratti. Psicofarmacologia 205: 273-283.

CrossRefMedline

4. ↵

1. Il cardinale RN,

2. Howes NJ

(2005) Effetti delle lesioni del nucleo accumbens core sulla scelta tra piccoli premi certi e grandi ricompense incerte nei ratti. BMC Neurosci 6: 37.

CrossRefMedline

5. ↵

1. Il cardinale RN,

2. Robbins TW,

3. Everitt BJ

(2000) Gli effetti della d-amfetamina, clordiazepossido, alfa-flupentixolo e manipolazioni comportamentali sulla scelta del rinforzo ritardato segnalato e non segnalato nei ratti. Psicofarmacologia 152: 362-375.

CrossRefMedline

6. ↵

1. Chudasama Y,

2. Robbins TW

(2004) Modulazione dopaminergica dell'attenzione visiva e della memoria di lavoro nella corteccia prefrontale dei roditori. Neuropsychopharmacology 29: 1628-1636.

CrossRefMedline

7. ↵

1. Cugini MS,

2. Wei W,

3. Salamone JD

(1994) Caratterizzazione farmacologica delle prestazioni in una procedura di scelta / pressione di una leva concomitante con leva: effetti di antagonisti della dopamina, colinomimetici, sedativi e farmaci stimolanti. Psicofarmacologia 116: 529-537.

CrossRefMedline

8. ↵

1. Denk F,

2. Walton ME,

3. Jennings KA,

4. Sharp T,

5. Rushworth MF,

6. Bannerman DM

(2005) Coinvolgimento differenziale dei sistemi di serotonina e dopamina nelle decisioni sui costi e benefici in merito al ritardo o allo sforzo. Psicofarmacologia 179: 587-596.

CrossRefMedline

9. ↵

1. Durstewitz D,

2. Seamani JK,

3. Sejnowski TJ

(2000) Modelli di neurocompressione della memoria di lavoro. Nat Neurosci 3 (Suppl): 1184-1191.

CrossRefMedline

10. ↵

1. Floresco SB,

2. Magyar O

(2006) Modulazione della dopamina mesocorticale delle funzioni esecutive: oltre la memoria di lavoro. Psicofarmacologia 188: 567-585.

CrossRefMedline

11. ↵

1. Floresco SB,

2. Whelan JM

(2009) Perturbazioni in diverse forme di processo decisionale costi / benefici indotte da ripetuta esposizione alle anfetamine. Psicofarmacologia 205: 189-201.

CrossRefMedline

12. ↵

1. Floresco SB,

2. Magyar O,

3. Ghods-Sharifi S,

4. Vexelman C,

5. Tse MT

(2006) Numerosi sottotipi di recettori della dopamina nella corteccia prefrontale mediale del ratto regolano il set-shifting. Neuropsychopharmacology 31: 297-309.

CrossRefMedline

13. ↵

1. Floresco SB,

2. Tse MT,

3. Ghods-Sharifi S

(2008a) Regolazione dopaminergica e glutamatergica dello sforzo e del processo decisionale basato sul ritardo. Neuropsychopharmacology 33: 1966-1979.

CrossRefMedline

14. ↵

1. Floresco SB,

2. St Onge JR,

3. Ghods-Sharifi S,

4. Winstanley CA.

(2008b) Circuiti cortico-limbico striatali che assoggettano diverse forme di processo decisionale costi-benefici. Cogn Affect Behav Neurosci 8: 375-389.

CrossRefMedline

15. ↵

1. Ghods-Sharifi S,

2. St Onge JR,

3. Floresco SB

(2009) Contributo fondamentale dell'amigdala basolaterale a diverse forme di processo decisionale. J Neurosci 29: 5251-5259.

Abstract / FREE Full Text

16. ↵

1. Grana S,

2. Passetti F,

3. Thomas KL,

4. Dalley JW,

5. Everitt BJ,

6. Robbins TW

(2000) Prestazioni attenzionali potenziate e compromesse dopo infusione di agenti recettori dopaminergici D1 nella corteccia prefrontale di ratto. J Neurosci 20: 1208-1215.

Abstract / FREE Full Text

17. ↵

1. Haluk DM,

2. Floresco SB

(2009) Modulazione della dopamina striatale ventrale di diverse forme di flessibilità comportamentale. Neuropsychopharmacology 34: 2041-2052.

CrossRefMedline

18. ↵

1. Hutton SB,

2. Murphy FC,

3. Joyce EM,

4. Rogers RD,

5. Cuthbert I,

6. Barnes TR,

7. McKenna PJ,

8. Sahakian BJ,

9. Robbins TW

(2002) Deficienze decisionali in pazienti con schizofrenia cronica e primo episodio. Schizophr Res 55: 249-257.

CrossRefMedline

19. ↵

1. Jocham G,

2. Klein TA,

3. Ullsperger M

(2011) I segnali di apprendimento del rinforzo mediati dalla dopamina nella corteccia prefrontale striato e ventromediale sono alla base delle scelte basate sul valore. J Neurosci 31: 1606-1613.

Abstract / FREE Full Text

20. ↵

1. Loos M,

2. Pattij T,

3. Janssen MC,

4. Counotte DS,

5. Schoffelmeer AN,

6. Smit AB,

7. Spijker S,

8. van Gaalen MM

(2010) L'espressione del gene D1 / D5 del recettore della dopamina nella corteccia prefrontale mediale predice la scelta impulsiva nei ratti. Cereb Cortex 20: 1064-1070.

Abstract / FREE Full Text

21. ↵

1. McLean A,

2. Rubinsztein JS,

3. Robbins TW,

4. Sahakian BJ

(2004) Gli effetti della riduzione della tirosina in volontari sani normali: implicazioni per la depressione unipolare. Psicofarmacologia 171: 286-297.

CrossRefMedline

22. ↵

1. Pagonabarraga J,

2. García-Sánchez C,

3. Llebaria G,

4. Pascual-Sedano B,

5. Gironell A,

6. Kulisevsky J

(2007) Studio controllato del processo decisionale e del deterioramento cognitivo nella malattia di Parkinson. Mov Disord 22: 1430–1435.

CrossRefMedline

23. ↵

1. Paxinos G,

2. Watson C

(1998) Il cervello di ratto in coordinate stereotassiche (Academic, San Diego), Ed 4.

24. ↵

1. Ragozzino ME

(2002) Gli effetti del blocco del recettore della dopamina D (1) nelle aree prelimbico-infralimbico sulla flessibilità comportamentale. Impara Mem 9: 18-28.

Abstract / FREE Full Text

25. ↵

1. Rogers RD,

2. Everitt BJ,

3. Baldacchino A,

4. Blackshaw AJ,

5. Swainson R,

6. Wynne K,

7. Baker NB,

8. Hunter J,

9. Carthy T,

10. Booker E,

11. Londra M,

12. Deakin JF,

13. Sahakian BJ,

14. Robbins TW

(1999) Deficit dissociabili nella cognizione della decisione di abusi cronici di anfetamine, abusi di oppiacei, pazienti con danno focale alla corteccia prefrontale e volontari normali impoveriti di triptofano: evidenza di meccanismi monoaminergici. Neuropsychopharmacology 20: 322-339.

CrossRefMedline

26. ↵

1. Schweimer J,

2. Hauber W

(2006) I recettori della dopamina D1 nella corteccia cingolata anteriore regolano il processo decisionale basato sullo sforzo. Impara Mem 13: 777-782.

Abstract / FREE Full Text

27. ↵

1. Schweimer J,

2. Saft S,

3. Hauber W

(2005) Coinvolgimento della neurotrasmissione della catecolamina nel cingolato anteriore del ratto nel processo decisionale relativo allo sforzo. Behav Neurosci 119: 1687-1692.

CrossRefMedline

28. ↵

1. Seamani JK,

2. Yang CR

(2004) Le principali caratteristiche e meccanismi della modulazione della dopamina nella corteccia prefrontale. Prog Neurobiol 74: 1-58.

CrossRefMedline

29. ↵

1. Seamani JK,

2. Floresco SB,

3. Phillips AG

(1998) Modulazione del recettore D1 di circuiti corticali prefrontali ippocampali che integrano la memoria spaziale con funzioni esecutive nel ratto. J Neurosci 18: 1613-1621.

Abstract / FREE Full Text

30. ↵

1. St Onge JR,

2. Floresco SB

(2009) Modulazione dopaminergica del processo decisionale basato sul rischio. Neuropsychopharmacology 34: 681-697.

CrossRefMedline

31. ↵

1. St Onge JR,

2. Chiu YC,

3. Floresco SB

(2010) Effetti differenziali delle manipolazioni dopaminergiche sulla scelta rischiosa. Psicofarmacologia 211: 209-221.

CrossRefMedline

32. ↵

1. St Onge JR,

2. Floresco SB

(2010) Contributo corticale prefrontale al processo decisionale basato sul rischio. Cereb Cortex 20: 1816-1828.

Abstract / FREE Full Text

33. ↵

1. Tappo CM,

2. Floresco SB

(2011) Contributi del nucleo accumbens e delle sue sottoregioni a diversi aspetti del processo decisionale basato sul rischio. Cogn Affect Behav Neurosci 11: 97-112.

CrossRefMedline

34. ↵

1. van Gaalen MM,

2. van Koten R,

3. Schoffelmeer AN,

4. Vanderschuren LJ

(2006) Coinvolgimento critico della neurotrasmissione dopaminergica nel processo decisionale impulsivo. Biol Psychiatry 60: 66-73.

CrossRefMedline

35. ↵

1. Williams GV,

2. Goldman-Rakic PS

(1995) Modulazione dei campi di memoria da parte dei recettori D1 della dopamina nella corteccia prefrontale. Natura 376: 572-575.

CrossRefMedline

36. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Robbins TW

(2005) Interazioni tra serotonina e dopamina nel controllo della scelta impulsiva nei ratti: implicazioni terapeutiche per i disturbi del controllo degli impulsi. Neuropsychopharmacology 30: 669-682.

Medline

37. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Il cardinale RN,

5. Robbins TW

(2006) Doppia dissociazione tra la modulazione serotoninergica e dopaminergica della corteccia prefrontale e orbitofrontale mediale della scelta impulsiva. Cereb Cortex 16: 106-114.

Abstract / FREE Full Text