De la Hoz, Iglesias y Pérez Coronel / INGE CUC, vol. 16 no. 1 pp. 234-240. Enero - Junio, 2020

Método Cluster-RNA para clasificar, caracterizar y pronosticar Perfiles competitivos del sector Tiendas Minoristas en la ciudad de Barranquilla

Cluster-RNA Method to Classify, Characterize and Predict Competitive Profiles of the Retail Stores Sector in the City of Barranquilla

DOI: http://doi.org/10.17981/ingecuc.16.1.2020.17

Artículo de Investigación Científica. Fecha de Recepción: 13/11/2019. Fecha de Aceptación: 03/04/2020

Efraín De la Hoz G.

Universidad de Cartagena. Cartagena (Colombia)

edelahozg@unicartagena.edu.co

María Iglesias

Universidad Simón Bolívar. Barranquilla (Colombia)

miglesias1@unisimonbolivar.edu.co

Leidy Pérez Coronel

Universidad Simón Bolívar. Barranquilla (Colombia)

laura.escobar@correo.uis.edu.co

.

Para citar este artículo:

E. De la Hoz G., M. Iglesias y L. Pérez Coronel, “Método Cluster-RNA para Clasificar, Caracterizar y Pronosticar Perfiles Competitivos del Sector Tiendas Minoristas en la Ciudad de Barranquilla”, INGE CUC, vol. 16, no. 1, pp. 234–240, 2020. DOI: http://doi.org/10.17981/ingecuc.16.1.2020.17

.

Resumen

Objetivo– Desarrollar un método para clasificar, caracterizar y pronosticar perfiles competitivos del sector tiendas minoristas a partir de la integración de la técnica de análisis de cluster y las redes neuronales artificiales.

Metodología– Para lo anterior se revisó la literatura relacionada con la competitividad de tiendas minoristas a partir de lo cual se identificaron variables asociadas a esta investigación. La información analizada corresponde a 224 tiendas de comercio minorista de la ciudad de Barranquilla.

Resultados– El análisis de cluster permitió caracterizar 4 perfiles competitivos del sector que mostraron ser homogéneos intragrupo y heterogéneos extragrupo, El modelo de red neuronal artificial mostró un 91,3% de clasificación correcta en la muestra de reserva, con lo cual se infiere la capacidad de clasificación del modelo de red y la capacidad discriminante de las variables relacionadas con el conocimiento de productos y precios, las prácticas de inventario y ventas, presencia en el mercado, atención diferenciada, ubicación y variedad de productos en los perfiles identificados.

ConclusionesLos resultados de la investigación muestran alta capacidad del método cluster-RNA, para clasificar y proyectar perfiles competitivos a partir de los cuales se pueden diseñar procesos de mejoramiento.

Palabras clave– Comercio minorista; análisis de conglomerado; red neuronal artificial

Abstract

Objective– To develop a method to classify, characterize and forecast competitive profiles of the retail stores sector based on the integration of the cluster analysis technique and artificial neural networks.

Methodology– For the above, the literature related to the competitiveness of retail stores was reviewed, from which variables associated with this research were identified. The information analyzed corresponds to 224 retail stores in the city of Barranquilla.

Results– The cluster analysis allowed to characterize 4 competitive profiles of the sector that showed to be homogeneous intragroup and heterogeneous extragroup. The artificial neural network model showed a 91.3% correct classification in the reserve sample, which inferred the capacity of classification of the network model and the discriminant capacity of the variables related to the knowledge of products and prices, the practices of inventory and sales, presence in the market, differentiated attention, location and variety of products in the identified profiles.

Conclusions– The results of the research show high capacity of the cluster-RNA method, to classify and project competitive profiles from which improvement processes can be designed.

Keywords– Retail; cluster analysis; artificial neural network

I. Introducción

El desarrollo económico de Colombia, ha estado marcado por la actividad industrial y agropecuaria, siendo el sector servicios un campo tradicionalmente con poco crecimiento y desarrollo. Sin embargo, hoy día este último viene cobrando importancia gracias a la dinámica alcanzada por los establecimientos comerciales en el aporte y participación en el crecimiento de la economía [1]. De esta manera, el mercado nacional de productos de consumo, se compone principalmente del mercado asociado al canal de grandes superficies y mercado del canal de tiendas de barrio (canal tradicional), siendo este el principal competidor de los grandes supermercados e hipermercados [1].

Las tiendas de barrio en Colombia, constituyen el 24% de los establecimientos comerciales pequeños [2]. Según resultados del VI Censo de Infomercio los productos con mayor demanda en las tiendas son lo perecederos, siendo las líneas básicas de consumo los alimentos, bebidas y cigarrillos, artículos de limpieza del hogar y aseo personal [2]. Así mismo, las tiendas de barrio tienen como segmento del mercado a personas que por sus ingresos no pueden acceder a compras semanales o quincenales en supermercados o que deben hacer reposición de productos antes de la próxima compra [3].

Factores como la proximidad, relación costo-beneficio y el servicio, representan aspectos motivadores para los clientes de las tiendas en sus decisiones de compra [2]. De lo anterior, esta investigación tiene como objetivo desarrollar un método para clasificar, caracterizar y pronosticar perfiles competitivos del sector tiendas minoristas en la ciudad de Barranquilla (Colombia), de lo que desprenden los siguientes interrogantes asociados al problema de investigación: ¿Cómo segmentar las tiendas de barrio para caracterizar sus condiciones competitivas?, ¿qué criterios de clusterización permiten identificar grupos homogéneos de clasificación de las tiendas de barrio?, ¿cómo pronosticar la pertenencia de una tienda de barrio a un perfil característico?

A. Análisis de conglomerado

Los métodos de análisis de grupos establecen conjuntos de elementos, casos o variables a partir de criterios cuantitativos o cualitativos utilizando criterios de distancia o similaridad [4]. En particular, la técnica multivariada de análisis de conglomerados, hace parte de los métodos de interdependencia que se utilizan para reconocer patrones en el comportamiento de un conjunto de observaciones [5]. Es utilizado en estudios exploratorios en donde no se tiene idea de la agrupación natural de los casos o variables. Constituye comúnmente la primera fase multivariante para investigaciones que impliquen la aplicación de otras técnicas como el análisis factorial o el escalamiento multidimensional [6].

Según Arroyo y Borja [7], el análisis de conglomerados permite abordar investigaciones cuyos objetivos sean: 1) Definir taxonomías que tengan las mismas características subyacentes en función de un conjunto de variables, sin pretender explicar el porqué de los agrupamientos; 2) formular hipótesis acerca de las relaciones entre grupos de variables u observaciones y teorizar sobre su cercanías y agrupación; 3) propósitos confirmatorios relacionados con la agrupación teórica de individuos o variables.

En esta técnica, no se tienen grupos predefinidos, estos se determinan mediante el cálculo de métricas asociadas a la distancia o similaridades de algunas variables adecuadas para ello. En este análisis de grupos, todas las variables contribuyen en igualdad de condiciones [4].

Esta técnica comúnmente es utilizada en la construcción de jerarquías, agrupación de observaciones o en la reducción del número de variables [5]. Para lo anterior, la técnica utiliza medidas de proximidad para determinar el nivel disimilaridad o similaridad de las observaciones, y criterios de eslabonamiento para agrupar observaciones. La distancia euclídea cuadrada es una medida de similaridad muy utilizada. La ecuación (1) muestra el calculo de la distancia euclidea cudrada, donde representa la distancia entre las muestras i y j, Xjk valor de la variable k en la muestra j, r el número de variables y Xik el valor de la variable k en la muestra i [8].

Por otra parte, el método de Ward también llamado método de varianza mínima corresponde a un criterio de eslabonamiento que minimiza la variación de la varianza para la formación de grupos homogéneos [9]. En la ecuación (2), W es el indicador del método de Ward, con indicador Xik que mide la variable en el individuo i del grupo g, X̅g indicador del valor medio del grupo g, ng cantidad de individuos que pertenecen al grupo g y G cantidad de grupos.

A. Redes neuronales artificiales

Son algoritmos basados en el proceso de aprendizaje de los seres biológicos, capaz de realizar aprendizaje automático y que tienen amplio potencial para su aplicación [10]. McMillan [11] especifica una Red Neuronal Artificial (RNA) como un sistema de cómputo no lineal compuesto de nodos que simulan el funcionamiento de una neurona biológica. Según García y Morales [12] las RNA constituyen una herramienta no tradicional que mejora el nivel de certidumbre en el proceso de toma de decisiones empresariales.

Según Álvarez [13] una RNA se constituye de múltiples unidades elementales interconectadas jerárquica y dinámicamente organizadas que procesan información de manera global y de manera paralela capaces de generalizar, asociar y aprender. Flórez y Fernández [14] definen la RNA formada por un conjunto de procesadores o neuronas artificiales que a partir de un vector de entrada de datos procedentes del mundo exterior o de otras neuronas proporcionan una respuesta única. En una RNA se reconocen tres capas: La capa de entrada, la capa de salida y la capa oculta. Para Pérez [15], las redes neuronales son sistemas capaces de reproducir los procesos que desarrolla el cerebro humano, reflejando características fundamentales de su comportamiento

En la Fig. 1, se presenta la arquitectura de una RNA, la capa de entrada representa los nodos en los que ingresan datos de las variables independientes, en la capa oculta se procesan los datos de entrada y la capa de salida proporciona la salida de los resultados (variable dependiente). El algoritmo compara los resultados observados con los resultados esperados y dependiendo del nivel de error, se ajustan los pesos sinápticos para reducirlo [16].

Fig. 1. Red Neuronal Artificial
Fuente: Adaptado de Caicedo y López [16].

II. Metodologìa

En este trabajo se propone y valida un método para evaluar y pronosticar perfiles competitivos que caracterizan el sector de tiendas minoristas de la ciudad de Barranquilla (Colombia) a partir de la aplicación del análisis de conglomerado como técnica de análisis multivariado para identificar grupos con características aproximadamente homogéneas y la aplicación del análisis de Red Neuronal Artificial (RNA) para la construcción de un modelo predictivo de clasificación. Para lo anterior, se revisó la literatura y estado del arte relacionado con el sector de tiendas minoristas, la competitividad, las técnicas de análisis multivariado y la red neuronal artificial, lo cual permitió realizar un análisis empírico y racional identificar factores asociados a la competitividad de tiendas minoristas.

En el estudio de las variables, se establecieron criterios para valorar, caracterizar y pronosticar perfiles competitivos del sector analizado, para lo cual se desarrolló un método que estructura el análisis de conglomerados en la caracterización de perfiles competitivos y un modelo de Red Neuronal Artificial (RNA) para pronosticar la pertenencia de tiendas minoristas a los perfiles competitivos característicos. Como método de investigación, se siguieron las etapas indicadas en la Fig. 2.

Fig. 2. Método para evaluar y pronosticar perfiles competitivos del sector tiendas minoristas.
Fuente: Autores.

Las variables y datos utilizados, hacen parte del trabajo de investigación realizado en 224 tiendas minoristas de Barranquilla [10]. Con los datos de las variables Conocimiento de productos y precios (V1), Realización de inventarios (V2), Ventas al por menor (V3), Presencia en el mercado (V4), Atención diferenciada (V5), Ubicación (V6) y Variedad de productos (V7) se aplicó la técnica análisis de conglomerado mediante el software Minitab 18 en el que analizaron los criterios de medida de similitud o distancia (Pearson, Pearson cuadrado, Euclidiano, Euclidiano cuadrado y Manhattan) y agrupamiento (Completo, Centroide Ward, Promedio e Individual) incluidos en el software, con lo cual se identificaron 4 perfiles característicos de competitividad en el sector tiendas minoristas.

Seguidamente para pronosticar y diagnosticar la pertenencia de tiendas a los perfiles competitivos identificados en el análisis de conglomerados, se estructuró un modelo de RNA mediante el software SPSS Statistics 25. En el proceso de modelamiento, se tomaron como variables de entrada las variables de competitividad del análisis de conglomerados con función de entrada de 2 dos capas y función Sigmoide. Una capa en la salida y función Tangente hiperbólica y variable de salida los perfiles de competitividad del análisis de conglomerados. Con lo anterior se desarrolló un método para evaluar y pronosticar perfiles competitivos característicos del sector tiendas minoristas de la ciudad de Barranquilla (Colombia). En la Fig. 2, se muestran los pasos seguidos en el método de evaluación y pronóstico de perfiles competitivos.

III. Resultados y Discusión

A partir de la información relacionada con las variables objeto de estudio en esta investigación, en 224 tiendas de comercio minorista, se desarrolló un análisis de conglomerado, en el que se evaluaron los grupos obtenidos con distintos criterios de agrupamiento y medidas de similaridad disponibles en el software Minitab 18. Los resultados muestran niveles aceptables de homogeneidad intragrupo y heterogeneidad extragrupo con el criterio de agrupamiento Ward y medida de similitud la distancia euclidiana cuadrada con 4 grupos o conglomerados, tal como se aprecia en el dendograma de la Fig. 3.

Fig. 3. Dendograma de perfiles competitivos del sector tiendas minoristas.
Fuente: Autores.

Los resultados de la Tabla 1 muestran el número de observaciones que conforman cada grupo o conglomerado, que para efectos de esta investigación se denominaron como perfiles. Así de las 224 observaciones, 24 observaciones caracterizan el perfil 1, 48 el perfil 2, 90 el perfil 3 y 62 el perfil 4. La distancia promedio desde el centroide muestra un valor de 2,008985 representativa del nivel de homogeneidad intragrupo

Tabla 1. Distancia promedio y máxima desde centroide de perfiles competitivos sector tiendas minoristas

Número de
observaciones

Dentro de la suma de cuadrados del conglomerado

Distancia promedio desde el centroide

Perfil 1

24

179,375

2,63692

Perfil 2

48

366,646

2,60427

Perfil 3

90

132,000

1,14620

Perfil 4

62

188,210

1,64855

Promedio

2,008985

Fuente: Autores.

Para evaluar el nivel de heterogeneidad entre grupos, se calcularon las distancias entre centroide de los 4 perfiles competitivos del sector tiendas minoristas. La Tabla 2 muestra las distancias promedio entre centroides, con promedio de 3,2094 comparativamente mayor a la distancia promedio desde los centroides, lo cual es representativo del nivel de discriminación de los perfiles.

Tabla 2. Distancia entre centroides de perfiles competitivos sector tiendas minoristas

Perfil 1

Perfil 2

Perfil 3

Perfil 4

Perfil 1

0,00000

3,34536

3,99735

3,70898

Perfil 2

3,34536

0,00000

3,36725

2,69943

Perfil 3

3,99735

3,36725

0,00000

2,13811

Perfil 4

3,70898

2,69943

2,13811

0,00000

Fuente: Autores.

En la Tabla 3 se presenta como medida de tendencia central, la moda de las puntuaciones de los perfiles respecto a las variables analizadas. La puntuación total acumulada determina el perfil 3 (puntuación = 35) como el más competitivo y el perfil 1 (puntuación = 27) como el menos competitivo.

Tabla 3. Caracterización de perfiles competitivos del sector tienda minorista

Perfil

Moda V1

Moda V2

Moda V3

Moda V4

Moda V5

Moda V6

Moda V7

Puntuación

Total

1

1

1

5

5

5

5

5

27

2

4

4

5

4

4

5

3

29

3

5

5

5

5

5

5

5

35

4

3

5

5

5

5

5

5

33

Fuente: Autores.

Seguidamente se estructura un modelo de Red Neuronal Artificial (RNA) compuesto de una red con dos capas tipo perceptrón multicapa, función tangente hiperbólica en la capa de entrada, función Sigmoide en la capa de salida, entrenamiento por lote y optimización mediante un algoritmo gradiente conjugado escalado. Para lo anterior se hizo uso del software SPSS, fijando el 50% de la data en la muestra de entrenamiento, 30% en la muestra de prueba y 20% en la muestra de reserva.

La Tabla 4 muestra los resultados de clasificación en cada una de las muestras del modelo. En la muestra de reserva se alcanzó un 100% de clasificación correcta en los perfiles 2 y 3, 84,6 en el perfil 4 y 0% en el perfil 1. Particularmente el perfil 1 observó un número reducido de unidades muéstrales clasificadas en este perfil, lo que dificulta su clasificación correcta por parte del modelo. En general el modelo RNA mostró un 91,3% de capacidad para clasificar correctamente una muestra en los perfiles competitivos identificados en el análisis de conglomerados.

Tabla 4. Resultados clasificación correcta del modelo RNA para perfiles competitivos del sector tiendas minoristas

Clasificación

Muestra

Observado

Pronosticado

1,00

2,00

3,00

4,00

Porcentaje correcto

Entrenamiento

1,00

0

9

5

0

0,0%

2,00

0

26

0

2

92,9%

3,00

0

0

40

0

100,0%

4,00

0

1

0

34

97,1%

Porcentaje global

0,0%

30,8%

38,5%

30,8%

85,5%

Pruebas

1,00

0

4

4

0

0,0%

2,00

0

9

1

2

75,0%

3,00

0

0

27

0

100,0%

4,00

0

1

1

12

85,7%

Porcentaje global

0,0%

23,0%

54,1%

23,0%

78,7%

Reserva

1,00

0

1

1

0

0,0%

2,00

0

8

0

0

100,0%

3,00

0

0

23

0

100,0%

4,00

0

2

0

11

84,6%

Porcentaje global

0,0%

23,9%

52,2%

23,9%

91,3%

Variable dependiente: Perfil

Fuente: Autores.

IV. Conclusiones

Los resultados de esta investigación, proporcionan al gremio de las tiendas minoristas un método de análisis de las condiciones competitivas asociadas a las variables conocimiento de productos y precios, registro de inventarios, ventas, presencia en el mercado, atención diferenciada, ubicación y variedad de productos, con lo cual se contribuye en la fundamentación de programas políticas públicas para su desarrollo.

Los resultados mostraron la capacidad y relevancia del método cluster-RNA para clasificar y pronosticar perfiles competitivos del sector tiendas minoristas en la ciudad de Barranquilla. Con el análisis de conglomerados se pudo clasificar 224 tiendas minoristas en 4 grupos característicos, con puntuación máxima de 35 y mínima de 27, con lo cual se pudo mostrar las características competitivas del sector.

También se pudo integrar el análisis de conglomerado y las redes neuronales artificiales para evaluar y pronosticar tiendas minoristas en perfiles característicos competitivos, alcanzándose un 91,3% de clasificación correcta. Es importante anotar que los resultados complementan los resultados de investigaciones previas, que también integran estas herramientas de análisis en el estudio de otros sectores [17]-[21] las cuales respaldan la importancia del método Cluster-RNA para clasificar, evaluar y pronosticar perfiles competitivos en otros sectores empresariales. Los resultados de esta investigación pueden usarse para clasificar, caracterizar y pronosticar perfiles competitivos en otros sectores empresariales. Así mismo es importante realizar otras investigaciones en las que se apliquen otras variables, distintas medidas de distancia o similaridad y criterios de agrupamiento en las que se evalúe la homogeneidad intragrupo y heterogeneidad extragrupo de perfiles competitivos empresariales.

Referencias

[1] E. L. Aldana, “Imagen y Posicionamiento de las Tiendas de Barrio en Colombia, aplicando el análisis factorial de correspondencias AFC”, Panorama Económico U. de C., vol. 225, no. 15, pp. 255281, Jan. 2015. Disponible en http://hdl.handle.net/11227/3742

[2] J. Córdoba & L. Cano, “Estudio de hábitos y valores de los consumidores del canal tradicional tiendas de barrio de la ciudad de Cali”, Entramado, vol. 5, no. 2, pp. 4463, Dec. 2009. Disponible en https://revistas.unilibre.edu.co/index.php/entramado/article/view/3354

[3] C. Martínez & M. Vergara, “Marketing relacional y su contribución a la competitividad en las tiendas de barrio del sur oriente de Barranquilla”. M.S. Thesis, UAC, BQ, CO, 2018.

[4] Q. Martin, M. Cabero & Y. De Paz, Tratamiento Estadístico de Datos con SPSS. Madrid, ES: Thomson Editores, pp. 145156, 2008.

[5] D. Peña, Análisis de datos multivariantes. Madrid, ES: McGraw Hill, pp. 137235, 2002.

[6] M. Ato, J. López, A. Velandrino & J. Sánchez, Estadística Avanzada con el paquete Systat. Murcia, ES: UMU, 1990.

[7] P. Arroyo & J. Borja, Análisis Multivariante para la inteligencia de Mercados. Monterrey, MX: Editorial Digital del ITESM, 2018.

[8] J. De la Garza, B. Morales & B. González, Análisis Estadístico Multivariante. Un enfoque teórico y práctico. México, D.F. MX: McGraw Hill, 2013.

[9] A. Catena, M. Ramos & H. Trujillo, Análisis Multivariado. Un manual para investigadores (Primera). Madrid, ES: Editorial Biblioteca Nueva, 2003.

[10] H. Alaka, L. Oyedele, H. Owolabi, V. Kumar, S. Ajayie, O. Akinade & M. Bilalf, “Systematic Review of Bankruptcy Prediction Models: Towards a Framework for Tool Selection”, Expert Syst. with Appl., vol. 94, pp. 164184, Mar. 2018. https://doi.org/10.1016/j.eswa.2017.10.040

[11] G. McMillan, Process/Industrial Instruments and Controls Handbook. USA: McGraw Hill, 2013.

[12] O. García & A. Morales, “Desempeño financiero de las empresas: una propuesta de clasificación por RNA”. Dimensión Empresarial, vol. 14, no. 2, pp. 1123. 2016. https://dx.doi.org/10.15665/rde.v14i2.686

[13] L. Álvarez, Fundamentos de inteligencia artificial. Murcia, ES: EDITUM, 1994.

[14] R. Flórez & J. Fernández, “Las Redes Neuronales Artificiales. Fundamentos teóricos y aplicaciones prácticas”. Madrid, ES: Netbiblo, 2008.

[15] C. Pérez, Redes Neuronales a través de ejemplos. Aplicaciones con Matlab. Scotts Valley, USA: CreateSpace Independent Publishing Platform, 2017.

[16] E. Caicedo & J. López, Una Aproximación Práctica a las Redes Neuronales Artificiales (Primera). Cali, CO: Programa Editorial Univalle, 2009. https://doi.org/10.25100/peu.64

[17] A. Ong, B. Uchino & E. Wethington, “Loneliness and health in older adults: A mini-review and synthesis”, Gerontology, vol. 62, pp. 44344449, Jun. 2016. https://doi.org/10.1159/000441651

[18] E. De la Hoz & L. López, “Aplicación de Técnicas de Análisis de Conglomerados y Redes Neuronales Artificiales en la Evaluación del Potencial Exportador de una Empresa”. Inf. Tecnol., vol. 28, no. 4, pp. 6774, Jan. 2017. https://doi.org/10.4067/S0718-07642017000400009

[19] E. De La Hoz, T. Fontalvo & L. López, “Análisis Envolvente de Datos y Cálculo Multivariado para Valorar, Clasificar y Predecir la Eficiencia Productiva y de Innovación de las Empresas del Sector Químico”, Inf. Tecnol, vol. 30, no. 5, pp. 213220, Oct. 2019. https://doi.org/10.4067/S0718-07642019000500213

[20] E. De la Hoz, J. Morelos & T. Fontalvo, “Methodology with multivariate calculation to define and evaluate financial productivity profiles of the chemical sector in Colombia”, IJPQM, vol. 27, no. 2, pp. 144160, Jun. 2019. https://doi.org/10.1504/IJPQM.2019.100141

[21] E. De la Hoz, J. Morelos & L. López, “Evaluación de la competitividad comercial del sector industrial colombiano mediante el coeficiente de apertura exportadora”, Aglala, vol. 10, no. 1, pp. 180195, 2019. Disponible en https://revistas.curn.edu.co/index.php/aglala/article/view/1343

Efraín de la Hoz G. es Doctor en Ingeniería Industrial. Jefe del departamento de Investigaciones de la facultad de Ciencias Económicas en la Universidad de Cartagena (Colombia). https://orcid.org/0000-0002-5196-813X

María Iglesias es Magister en Administración de empresas e innovación. Coordinadora de investigación y extensión en la facultad de Ingeniería de la Universidad Simón Bolívar (Colombia). https://orcid.org/0000-0002-0079-1346.

Leidy Pérez Coronel es Magister en Ingeniería Industrial. Profesional de publicaciones de la Universidad Simón Bolívar (Colombia) y Coeditora de la Revista Investigación e Innovación en Ingenierías. https://orcid.org/0000-0001-5665-9910