Treure registres de dades duplicats a Excel
Els programes de full de càlcul com Excel solen utilitzar-se com a bases de dades per a coses com inventaris de peces, registres de vendes i llistes de correu.
Les bases de dades en Excel estan formades per taules de dades que normalment s'organitzen en files de dades anomenades registres.
En un registre, les dades de cada cel·la o camp de la fila es relacionen, com ara el nom d'una empresa, l'adreça i el número de telèfon.
Un problema comú que es produeix quan una base de dades creix en grandària és el de registres duplicats o files de dades.
Aquesta duplicació pot passar si:
- Tots els registres s'introdueixen a la base de dades més d'una vegada, resultant en dos o més registres idèntics
- Els registres múltiples tenen un o més camps, com ara un nom i una adreça, que contenen les mateixes dades.
De qualsevol manera, els registres duplicats poden causar una gran quantitat de problemes, com enviar diverses còpies de documents a la mateixa persona quan la informació de la base de dades s'utilitza en una combinació de correu, de manera que és convenient escanejar i eliminar registres duplicats de forma regular base.
I encara que és fàcil escollir registres duplicats en una petita mostra com la de la imatge anterior, les taules de dades podrien contenir fàcilment centenars, si no milers de registres, el que fa que sigui molt difícil triar registres duplicats, especialment els registres parcialment coincidents.
Per facilitar l'acompliment d'aquesta tasca, Excel té una eina de dades integrada anomenada, no sorprenentment, Treure duplicats, que es pot utilitzar per trobar i eliminar registres idèntics i parcialment coincidents.
No obstant això, la forma en què la Treure duplicats l'eina està dissenyada, els registres idèntics i parcialment coincidents s'han de tractar per separat.
Això és degut a que la Treure duplicats quadre de diàleg mostra els noms de camp per a la taula de dades seleccionada i trieu els camps que cal incloure a la cerca de registres coincidents:
- Per a registres idèntics, cerqueu tots els camps: deixeu marques de verificació al costat de tots els noms de columna o camp;
- Per a registres parcialment coincidents, deixeu marques de verificació al costat de només aquells camps que es vincularan.
Noms de camps versus cartes de columnes
Com es va esmentar, el Treure duplicats L'eina consisteix en un quadre de diàleg on trieu els camps coincidents que voleu cercar des del nom del camp o la columna desitjats.
La informació que mostra el quadre de diàleg - noms de camp o lletres de columna - depèn de si les vostres dades contenen una fila de títols, o bé encapçalaments - a la part superior de la taula de dades tal com es pot veure a la imatge de dalt.
Si ho fa, assegureu-vos que l'opció a la part dreta del quadre de diàleg - Les meves dades tenen capçaleres - està desactivat i Excel mostrarà els noms d'aquesta fila com a noms de camp al quadre de diàleg.
Si les dades no tenen una fila de capçalera, el quadre de diàleg mostrarà les lletres de columna adequades al quadre de diàleg de l'interval de dades seleccionat.
Gamma contigua de dades
Per al Treure duplicats L'eina per funcionar correctament, la taula de dades ha de ser un conjunt de dades contigus, és a dir, no ha de tenir cap fila o columna buida i, si és possible, no hi ha cap cel·la buida situada a la taula.
No tenir espais en blanc dins d'una taula de dades és una bona pràctica pel que fa a la gestió de dades en general i no només a la recerca de dades duplicades. Les altres eines de dades d'Excel, com ara classificar i filtrar, funcionen millor quan la taula de dades és un rang de dades contigu.
Treure l'exemple de registres de dades duplicats
A la imatge de dalt, la taula de dades conté dos registres idèntics A. Thompson i dos registres parcialment coincidents per R. Holt - on tots els camps coincideixen, excepte el nombre de l'alumne.
Els passos que es detallen a continuació indiquen com utilitzar el Treure duplicats eina de dades a:
- Elimineu el segon de dos registres idèntics per a A. Thompson .
- Elimineu el segon registre parcialment coincident per a R. Holt .
Obrir el quadre de diàleg Eliminar duplicats
- Feu clic a qualsevol cel·la que contingui dades a la base de dades d'exemple.
- Feu clic al Dades pestanya a la cinta.
- Feu clic al Treure duplicats icona per ressaltar totes les dades a la taula de dades i obrir la finestra Treure duplicats Caixa de diàleg.
- El Treure duplicats El quadre de diàleg mostra tots els encapçalaments de columna o noms de camp de la nostra mostra de dades
- Les marques de verificació al costat dels noms de camp indiquen quines columnes Excel tractaran de coincidir a la recerca de registres duplicats
- Per defecte, quan el quadre de diàleg s'obre, tots els noms de camp estan desactivats
Trobar registres idèntics
- Com que estem buscant registres completament idèntics en aquest exemple, deixarem tots els encapçalaments de columna marcats
- Feu clic D'acord
En aquest punt cal veure els següents resultats:
- El quadre de diàleg ha de tancar-se i ser reemplaçat per un missatge que diu: 1 valor duplicat trobat i eliminat; Queden 7 valors únics.
- La fila que conté el duplicat A. Thompson el registre s'haurà eliminat de la base de dades
- Tot i que hi ha dos registres parcialment coincidents R. Hol t, perquè no tots els camps coincideixen: el nombre d'alumne dels dos registres difereix, Excel considera que és un registre de dades únic
Cerqueu i elimineu els registres parcialment coincidents amb la supressió de duplicats
Comprovació d'un camp a la vegada
Atès que Excel només elimina registres de dades que coincideixen exactament amb els camps de dades seleccionats, la millor manera de trobar tots els registres de dades que coincideix parcialment és eliminar la marca de verificació per només un camp alhora, tal com es fa als passos següents.
Les cerques posteriors de registres que coincideixen en tots els camps, excepte el nom, l'edat o el programa, eliminaran totes les combinacions possibles per als registres parcialment coincidents.
Trobar registres parcialment coincidents
- Feu clic a qualsevol cel·la que contingui dades a la taula de dades si és necessari
- Feu clic al Dades pestanya a la cinta.
- Feu clic al Treure duplicats icona per ressaltar totes les dades a la taula de dades i obrir la finestra Treure duplicats Caixa de diàleg.
- Es seleccionen tots els noms de camp o encapçalaments de columna de la taula de dades.
- Per trobar i eliminar registres que no tinguin una coincidència en tots els camps, elimineu la marca de verificació a més dels noms de camps que ignorarà Excel.
- Per a aquest exemple, feu clic a la casella de verificació al costat del Identificador d'estudiant encapçalament de columna per treure la marca de verificació.
- Excel només cercarà i eliminarà registres que tinguin dades coincidents al fitxer Cognom , Inicial , i Programa camps.
- Feu clic D'acord
- El quadre de diàleg ha de tancar-se i ser reemplaçat per un missatge que diu: 1 valor duplicat trobat i eliminat; Queden 6 valors únics.
- La fila que conté el segon registre per a R. Holt amb la identificació d 'estudiant de ST348-252 s'haurà eliminat de la base de dades.
- Feu clic D'acord per tancar el quadre de missatge
En aquest punt, la taula de dades d'exemple ha de ser lliure de totes les dades duplicades.