12 de julio de 2009

ENCONTRAR DUPLICADOS EN UNA LISTA DE DATOS

De las diversas técnicas para hallar los valores duplicados en una lista de datos, estas son las más usadas:

1) Mediante formato condicional, aplicado al rango de datos: Puede establecerse una regla de Formato condicional (menú Formato > Formato condicional…) que mediante una fórmula haga el recuento de ocurrencias de un valor dentro de un rango, y cuándo ese recuento sea mayor que 1 (es decir, se repite), el fondo de la celda se rellene con cierto color, identificando así todos los duplicados.

En este caso selecciona primero el rango B3:B14, elige Formato condicional, completa la fórmula CONTAR.SI(rango,criterio) para la celda B3 y establece la condición >1, define a continuación un formato a aplicar cuando se cumpla esa condición y pulsa Aceptar.

Nota: El rango será aquel que quieras evaluar (en mi caso solo unas pocas celdas), y el criterio la celda para la que buscamos duplicados. Observa que el rango se establece como referencia absoluta (tiene doble $) pero el criterio no; esto es así para que el formato condicional se aplique correctamente a todas las celdas del rango seleccionado inicialmente.

image

Nota 2: Más abajo encontrarás opciones avanzadas del formato condicional para encontrar y destacar duplicados.

2) Con una columna auxiliar que cuente las ocurrencias de cada valor, mediante la función CONTAR.SI o la función matricial CONTAR. Cuando el valor en la columna auxiliar sea >1 es que se trata de un valor repetido, e indica cuántas veces.

image

3) Indicar qué filas contienen un valor repetido, en vez del número de repeticiones:

image

4) Indicar qué filas contienen un valor repetido, pero sin mostrar la primera ocurrencia: Es una variante del anterior, que solo marca como “repetición” a partir de la segunda ocurrencia, para que puedas borrar con seguridad solo las repeticiones. Observa la variación en el rango de la función CONTAR.SI respecto al caso anterior:

image

5) Identificar si hay valores de la lista A incluidos en la lista B: Si necesitas comparar dos listas separadas de datos para identificar repeticiones de los valores de una en la otra, puedes usar esta fórmula:

image

6) Otras formas de encontrar duplicados: Si el orden de la lista no es importante, la forma más sencilla de identificar duplicados es primero ordenarla (por ejemplo de menor a mayor si son números, y alfabética si son palabras), y luego poner una sencilla fórmula SI que muestre los duplicados por comparación con la celda inmediatamente superior:

image

7) Formato condicional avanzado: Estas fórmulas las he tomado de Chip Pearson, como casos especiales de formato condicional relativos a la búsqueda de duplicados:

7.a) Puedes definir la fórmula del formato condicional del punto 1 para destacar los valores que ocurren solamente una vez, en vez de los duplicados.

image

7.b) Si quieres destacar únicamente la primera ocurrencia de los valores duplicados:

image

7.c) Si quieres destacar únicamente los duplicados a partir de la segunda ocurrencia:

image

8) Encontrar el número de valores distintos (no duplicados) de una lista: De nuevo uso una fórmula de Chip Pearson, genial como siempre.

image

No hay comentarios:

Publicar un comentario