#CLACSO2018

Uno de los factores que más han jugado en la transformación neoliberal de la educación (Laval, 2004) ha sido el incremento y expansión en los últimos 15 a 20 años de los sistemas de control (Garland 2002), auditoria (Power 1999; Werner 2013) y especialmente, la aplicación de pruebas estandarizadas en diversos tramos de la escolaridad básica y no sólo en el acceso a la educación terciaria (Ravich, 2011, 2013, Sahlberg 2012, 2016; Rushek, 2016). Aunque la historia de la aplicación de pruebas estandarizadas se puede remontar a las primeras décadas del siglo XX (Gould 1984; Ovejero Bernal, 2003; Giordano 2007) es a partir de los años setenta, cuando podemos datar un constante incremento de las mismas. Un incremento que ya no se sitúa exclusivamente en los puntos terminales de la escolaridad como vía de acceso a la enseñanza universitaria (Moreno Olmedilla 1992), sino que dichas pruebas se encuentran repartidas a lo largo de la misma. Esta política (policy action) comenzó justamente con la aparición de gobiernos abiertamente neoliberales en el mundo anglosajón, pero significativamente en USA y en UK (Broadfoot, 1983, 1984, 1986; Angulo 1995; Clarke, Madaus, Hron & Ramos, 2000; Gipps 2002; Stobart 2010). Sin embargo, uno de los turning points fue en su día la aprobación por la administración de G.W. Bush del No Child Left Behind Act of 2001. En dicha ley se equiparaba aumento del rendimiento en el aprendizaje y reducción de la desigualdad con un incremento de Higher-Stake Testing (Franklin Abernaty 2007, Berkhart 2008). Al igual que con las reformas sucesivas y constantes en la aplicación de test en UK durante los años noventa del siglo XX, la nueva ley legitimaba políticamente la vía exclusiva de reforma y mejora de los sistemas educativos (desoyendo y ninguneando la literatura previa sobre estos campos). Reforma y mejora que ahora dependían de la eficacia de los instrumentos de medida.
Ello ha permitido, como ha señalado reiteradamente Shalberg (2012, 2016) que el muy conservador y neoliberal modelo denominado General Educational Reform Movement (GERM), de la mano de dichos instrumentos, se haya ido extendiendo (Giordano 2007; Kamens & McNeely 2010; Rushek, 2016). En este sentido, en los países de la OCDE (Morris, 2011; Defaux 2012), se han acrisolando no sólo supuestas pruebas diagnósticas como PISA, sino también la aplicación intensiva de los test estandarizados nacionales; al igual que está ocurriendo en Latinoamérica de la mano del Laboratorio Latinoamericano de evaluación de la calidad de la Educación y sus sucesivas pruebas (PERCE, SERCE, TERCE). En uno y otro caso, las consecuencias han sido más negativas que positivas y la literatura científica en este sentido es considerable y clara (Madaus 1988, 1990; Madaus, Russell & Higgins 2009; Nichols & Berliner 2005, 2007; Taubman 2009, Ravitch 2011, 2013). Aquí actúa, de manera inexorable, la olvidada Ley de Campbell (1979: 85): The more any quantitative social indicator is used for social decision-making, the more subject it will be to corruption pressures and the more apt it will be to distort and corrupt the social processes it is intended to monitor. Una ley que vale no sólo para las pruebas estandarizadas aplicadas en cada nación (como por ejemplo el SIMCE en Chile), sino también para otras pruebas internacionales, como es el caso de PISA; algo que han sabido ver algunos autores (Carnoy & Rothstein 2013; Kreiner 2011; Grek 2009; Pereyra et alli 2011; Meyer & Benavot 2013). La educación y la práctica curricular dejan de estar orientadas e informadas por profesionales (pedagogos, maestros/as, psicólogos/as) o comunidades educativas ciudadanas; ni siquiera lo están por las administraciones educativas en simbiosis interesada con cuerpos de expertos (psicómetras/económetras) dentro o fuera de la administración misma, y/o conglomerados que actúan como corporaciones como en el caso de la OCDE y su prueba estrella PISA (por no mencionar el Banco Mundial; Toussaint, 2007), imitando a las agencias de valoración al estilo de Standard & Poor's, pero en educación. No de otra manera puede explicarse el afán de elaborar rankings de países y de promover benchmarkings y que, además, sean dichas prueba las encargada de asentar la calidad de los sistemas educativos. En este contexto una de las amenazas política a la que nos enfrentamos (amenaza que no es exclusiva de Latinoamérica) no se encuentra únicamente en la reducción estandarización y presión a la que, como acabamos de señalar, se ven sometidos los sistemas educativos, sino también a la pérdida de la capacidad de diálogo y de profundización democrática necesaria para su desarrollo. Las pruebas estandarizadas nacionales o internacionales forcluyen y clausuran cualquier tipo de debate público sobre las políticas educativas y sobre los sistemas educativos y su calidad. En este punto tenemos que traer a colación los modelos de evaluación democrática, dialógica y participativa que, surgiendo en los años 70 del siglo pasado, se han ido desarrollando. Aquí tenemos que mencionar los ejemplos de la evaluación democrática de MacDonald (1976), la evaluación participativa (Fals Borda 1987; Cousins & Earl 1992; Gaventa, 1993; Brisolara,1998; Cornwall & Gaventa, 2001), la Evaluation Deliberativa (House & Howe, 2000), la Evaluación Personalizada (Kushner, 2002) y la Evaluación focalizada en la conciencia crítica (Patton, 2017) que se apoya fuertemente en las ideas de Paulo Freire. Estos modelos y otros similares nos ofrecen cuatro ideas claves para reorientar la evaluación pública de los sistemas educativos. Estas ideas clave son las siguientes: inclusividad, participación, dialogo y deliberación. Sólo de este modo podremos reforzar y apoyar la democracia y la movilización de nuestra ciudadanía en la mejora de la calidad de nuestros sistemas educativos. Y ese es el gran reto político de la evaluación educativa.
surgiendo en los años 70 del siglo pasado se han ido desarrollando. Aquí tenemos que mencionar los ejemplos de la evaluación democrática de MacDonald (1976), la evaluación participativa transformadora (Fals Borda 1980; Gaventa, 1993; Cornwall & Gaventa), la Deliberative Democratic Evaluation (House & Howe, 2000), la Evaluación Personalizada (Kushner, 2000) y la Evaluación focalizada en la conciencia crítica (Patton, 2017) que se apoya fuertemente en las ideas de Paulo Freire. Estos modelos y otros similares nos ofrecen cuatro ideas claves para reorientar la evaluación pública de los sistemas educativos. Estas ideas clave son las siguientes: inclusividad, participación, dialogo y deliberación. Sólo de este modo podremos reforzar y apoyar la democracia y la movilización de nuestra ciudadanía en la mejora de la calidad de nuestros sistemas educativos
Referencias

Broadfoot, Patricia (1983). Evaluation and the social order in advanced industrial societies: the educational dilema. International Review of Applied psychology, 32: 307-325.
Broadfoot, Patricia (Comp.) (1984) Selection, Certification & Control. Social Issues in Educational Assessment. London. The Falmer Press. 
Broadfoot, Patricia (1986) Assessment Policy and Inequality: The United Kingdom Experience. British JOurnal of Sociology of Education, 7 (2): 205.224.
Carnoy, Martin & Rothstein, Richard (2013) What do international tests rally show about U.S. Student performance? Economic Policy Institute. Report. January 28.Washington.
Clarke, M. M, Madaus, G. F. Hron, C.L. & Ramos, M.A. (2000) Retrospective on educational testing and assessment in the 20th century. J. CURRICULUM STUDIES, VOL. 32, NO. 2, 159-181.
Cornwall, Andrea and Gaventa, John (2001) Bridging the gap: citizenship, participation and accountability. PLA Notes. February: 32-35.
Dufaux, S. (2012), "Assessment for Qualification and Certification in Upper Secondary Education: A Review of Country Practices and Research Evidence", OECD Education Working Papers, No. 83, OECD Publishing, Paris.
Fals-Borda, O. (1987). TheApplication of Participatory Action.-Research in Latin America. International Sociology, 1987, 2 (4): 329-347 
Gaventa, J. (1993). The powerful, the powerless and the experts: knowledge struggles in a information age. En Park, Peter; Hall, Budd & Jackson, Ted (eds). (1993). Participatory Research in North America. Amherst, MA: Bergin and Hadley.
Garland, (2002). The Culture of Control: Crime and Social Order in Contemporary Society. Chicago. University of Chicago Press. 
Grek, Sotiria (2009). Governing by numbers: The PISA ‘effect’ in Europe. Journal of Education Policy, 24:1, 23-37, DOI: 10.1080/02680930802412669
Gipps, Carolin (2002) Beyond Testing: Towards a Theory of Educational Assessment. London. Taylor & Francis
Giordano, Gerard (2007). How testing came to dominate American Schools. The history of educational assessment. New York. Peter Lang.
Gould, S. J. (1984). La Falsa Medida del hombre. Barcelona. Antoni Bosch. 
Kamens, David H. & McNeely, Connie L. (2010). Globalization and the Growth of International Educational Testing and National Assessment. Comparative Education Review, 54 (1): 5- 25.
Kreiner, Svend (2011). Is the foundation under PISA solid? A critical look at the scaling model underlying international comparisons of student attainment. Research Report 11/1 Department of Biostatistics. University of Copenhagen.
Laval, Christian (2004). La escuela no es una empresa. Barcelona. Paidós 
Madaus, G. F. (1988). The Distortion of Teaching and Testing: High-Stakes Testing and Instruction. Peabody Journal of Education, 65 (3): 29-46. 
Madaus, G. F. (1990). Testing as a social technology. Inaugural Annual Boisi Lecture in Education and Public Policy. Boston College. December 6.
Madaus, George, Russell, Michael & Higgins, Jennifer (2009). The paradox of high stakes testing. How thet affect students, their parents, teachers, principals, schools, and society. Charlote, NC. IAP, Inc.
Meyer, Heinz-Dieter & Benavot, Aaron (Eds.) (2013) PISA, power, and policy. The emergence of global educa