In deze tutorial leer je hoe je snel en eenvoudig redundante gegevens kunt opschonen in Google Sheets, met name door het verwijderen van duplicaten. Vaak hebben we gegevens die afkomstig zijn uit verschillende bronnen of niet in de juiste structuur staan. Dit vereist dat we gerichte stappen ondernemen om gegevens op te schonen, zodat de resultaten van onze analyses niet worden vertekend. In deze tutorial laat ik je zien hoe je met specifieke functies en tools in Google Sheets je datasets kunt opschonen om je werk efficiënter te maken.
Belangrijkste inzichten
- Duplicaten kunnen snel worden geïdentificeerd en verwijderd met de functie "Duplicaten verwijderen".
- De juiste opmaak van de gegevens is cruciaal om duplicaten te kunnen detecteren.
- Met de functie "Tekst naar kolommen" kun je de gegevens beter structureren voordat je duplicaten verwijdert.
Stapsgewijze handleiding
Om je gegevens effectief op te schonen, zijn er verschillende stappen die je moet volgen. Ik zal je door dit proces begeleiden.
Stap 1: Gegevens opsplitsen in kolommen
Het kan handig zijn als je gegevens al in de juiste structuur staan. Een veelvoorkomend scenario is dat voornamen en achternamen in één cel staan.
Om dit te doen, markeer je eerst de cel of het bereik met de namen.
Ga vervolgens naar het bovenste menu en selecteer het tabblad "Gegevens" en kies de optie "Tekst naar kolommen".
Je kunt nu het scheidingsteken selecteren, zoals een spatie. Als je een spatie selecteert als scheidingsteken, worden de namen correct verdeeld over twee aparte kolommen.
Vervolgens kun je elke cel passend benoemen, zodat voornamen in één kolom en achternamen in de andere kolom worden weergegeven.
Stap 2: Identificeren en Verwijderen van Duplicaten
Nadat je gegevens in de juiste structuur staan, kunnen we nu kijken naar duplicaten. Duplicaten vertroebelen vaak de analyse en moeten daarom worden verwijderd.
Selecteer eerst het volledige bereik met de duplicaten. Als je bijvoorbeeld een lijst van landen wilt opschonen, selecteer je de desbetreffende kolom.
Klik vervolgens opnieuw op het tabblad "Gegevens" en kies "Duplicaten verwijderen".
Je kunt de kolommen selecteren die gecontroleerd moeten worden op duplicaten. In dit geval selecteer je alleen de kolom met de landen.
Nadat je de selectie hebt gemaakt, klik je op "Duplicaten verwijderen". Google Sheets zal nu alle geïdentificeerde duplicaten weergeven die uit je lijst kunnen worden verwijderd. Met meer dan 500 regels kan het zijn dat er 466 als duplicaten worden herkend en verwijderd, waardoor alleen unieke vermeldingen overblijven.
Stap 3: Ongelijkheid door spaties elimineren
Een veelvoorkomend probleem bij het identificeren van duplicaten zijn ongewenste spaties die niet altijd zichtbaar zijn. Als je bijvoorbeeld twee vermeldingen hebt die er hetzelfde uitzien maar in werkelijkheid verschillend zijn, kan dit komen door de spaties.
Om ervoor te zorgen dat alle duplicaten correct worden geïdentificeerd, ga terug naar het tabblad "Gegevens" en klik op "Spaties verwijderen".
Nu kun je opnieuw de functie "Duplicaten verwijderen" gebruiken om ervoor te zorgen dat alle overbodige vermeldingen daadwerkelijk worden verwijderd. Als alleen nog unieke vermeldingen worden weergegeven, heb je het opschoningsproces succesvol voltooid.
Samenvatting
In deze handleiding heb je geleerd hoe je in Google Sheets met behulp van de "Duplikaten verwijderen" functie dubbele vermeldingen kunt identificeren en verwijderen. Het vooraf opruimen van je gegevens, vooral door tekst op te splitsen in kolommen en door het verwijderen van spaties, is essentieel voor een succesvolle gegevensanalyse.
Veelgestelde Vragen
Welke functie gebruik je om duplicaten in Google Sheets te verwijderen?De functie "Duplikaten verwijderen" helpt je bij het identificeren en verwijderen van dubbele gegevens.
Hoe kan ik ervoor zorgen dat spaties mijn duplicaten niet hinderen?Je kunt de functie "Spaties verwijderen" op het tabblad "Gegevens" gebruiken om extra spaties te elimineren.
Kan ik meerdere kolommen tegelijk controleren op duplicaten?Ja, je kunt bij het verwijderen van duplicaten meerdere kolommen selecteren om dubbele vermeldingen te verwijderen op basis van verschillende criteria.