Отстрани дупликати редови на податоци во Excel

01 од 02

Отстрани ги дуплираните податоци во Excel

Отстранете ги дупликатите - Пребарување на идентични записи по име на поле. © Ted French

Програмите за табеларни пресметки како што се Excel често се користат како бази на податоци за работи како што се залихи на делови, записи за продажба и мејлинг-листи.

Базите на податоци во Excel се состојат од табели на податоци кои вообичаено се организираат во редови на податоци наречени записи.

Во евиденција, податоците во секоја ќелија или поле во редот се поврзани - како што се името на компанијата, адреса и телефонски број.

Честа проблем што се јавува како база на податоци расте во големината е онаа на дупликат евиденција или редови на податоци.

Ова дуплирање може да се случи ако:

Во секој случај, дупликат евиденција може да предизвика цела низа проблеми - како што испраќа повеќе копии на документи на истото лице кога податоците за базата на податоци се користат во спојувањето на поштата - па затоа е добра идеја да скенирате и отстраните дупликат евиденција на редовна основа.

И додека е лесно да се одберат дупликат записи во мал примерок како оној на сликата погоре, табелите за податоци може лесно да содржат стотици, ако не и илјадници записи, поради што е многу тешко да се изберат дупликати записи - особено делумно совпаѓање на записи.

За да може полесно да се постигне оваа задача, Excel има вградена алатка за податоци наречена, не е изненадувачки, Отстранете ги дупликатите , кои може да се користат за да се пронајдат и отстранат идентични, како и делумно совпаѓање на записи.

Меѓутоа, начинот на којшто е дизајниран алатката Remove Duplicates , идентичното и делумно совпаѓачките записи мора да се разгледа одделно.

Ова е затоа што дијалогот Отстрани дупликати ги прикажува имињата на полето за избраната табела на податоци и одбирате кои полиња да ги вклучите во пребарувањето за записите за појавување:

Имиња на полиња наспроти колумни писма

Како што рековме, алатката Отстрани дупликати се состои од дијалог-кутија каде што ќе одберете кои полиња за пребарување ќе ги пребарувате со одјавување на саканите имиња на поле или колона.

Информациите што дијалогот го прикажува - имиња на полиња или букви од колони - зависи од тоа дали вашите податоци содржат ред на заглавија - или заглавија - на врвот на табелата со податоци како што се гледа на горната слика.

Ако тоа го направи - осигурете се дека опцијата од десната страна на дијалогот - Мои податоци има заглавија - е исклучена и Excel ќе ги прикаже имињата во овој ред како имиња на полето во полето за дијалог.

Доколку вашите податоци немаат ред во заглавјето, дијалогот ќе ги прикаже соодветните колони во дијалогот за избраниот опсег на податоци.

Соседни опсег на податоци

За отстранување на алатката Отстрани дупликати да работи правилно, табелата со податоци мора да биде сосема опсег на податоци - тоа не смее да има празни редови, колони и, ако е можно, нема празни ќелии што се наоѓаат во табелата.

Немањето празни места во табелата со податоци е добра практика кога станува збор за управувањето со податоците воопшто, а не само кога се бараат дупликати податоци. Другите алатки за податоци на Excel - како што се сортирање и филтрирање - работат најдобро кога табелата со податоци е сосема опсег на податоци.

Отстрани Пример за запис на Duplicate Data Records

На сликата погоре, табелата со податоци содржи две идентични записи за A. Thompson и две делумно соодветни записи за R. Holt - каде сите полиња се совпаѓаат со бројот на студент.

Чекорите наведени подолу детално опишуваат како да се користи алатката за податоци за Отстрани дупликати на:

  1. Отстранете ја втората од двете идентични записи за А. Томсон.
  2. Отстранете го вториот делумно совпаѓачки запис за R. Holt.

Отворање на дијалогот Отстрани дупликати

  1. Кликнете на која било ќелија која содржи податоци во базата на податоци за примероци.
  2. Кликнете на табот Data на лентата.
  3. Кликнете на иконата Remove Duplicates за да ги означите сите податоци во табелата со податоци и да го отворите дијалогот Отстрани дупликати .
  4. Дијалогот Отстрани дупликати ги прикажува сите заглавија на колоните или имињата на полињата од примерокот на податоци
  5. Знаците за проверка веднаш до имињата на поле покажуваат кои колони ќе се обидат да се совпаднат со Excel во потрага по дупликат записи
  6. Стандардно, кога дијалогот ќе се отвори, сите имиња на полето се исклучени

Наоѓање идентични записи

  1. Бидејќи ние бараме целосно идентични записи во овој пример, ќе ги оставиме сите наслови на колоните да бидат проверени
  2. Кликнете ОК

Во овој момент треба да се видат следните резултати:

02 од 02

Најдете и отстрани записници со делумно совпаѓање со Отстранете ги дупликатите

Отстранете ги дупликатите - Барајте записи за делумно совпаѓање по име на поле. © Ted French

Проверка на едно поле во исто време

Бидејќи Excel само ги отстранува записите на податоци кои точно се совпаѓаат за избраните полиња на податоци, најдобриот начин за наоѓање на сите делумно совпаѓачки податоци е да се отстрани ознаката за проверка само за едно поле, исто како што се прави во чекорите подолу.

Следните пребарувања на записи кои се совпаѓаат во сите полиња, освен името, возраста или програмата, ќе ги отстранат сите можни комбинации за делумно совпаѓање на записите.

Наоѓање на записите со делумно совпаѓање

  1. Кликнете на која било ќелија што содржи податоци во табелата со податоци, доколку е потребно
  2. Кликнете на табот Data на лентата .
  3. Кликнете на иконата Remove Duplicates за да ги означите сите податоци во табелата со податоци и да го отворите дијалогот Отстрани дупликати .
  4. Селектирани се сите имиња на полиња или насловите на колони за табелата со податоци.
  5. За да пронајдете и отстраните записи што немаат совпаѓање во секое поле, отстранете го знакот за проверка покрај оние имиња на полето што Excel треба да ги игнорира.
  6. За овој пример, кликнете на полето за проверка покрај табулаторот за Студентски проект за отстранување на ознаката за проверка.
  7. Excel сега ќе пребарува и ќе ги отстранува записите кои имаат соодветни податоци во полето Last Name , Initial и Program .
  8. Кликнете ОК
  9. Прозорецот за дијалог треба да се затвори и да биде заменет со порака што вели: 1 пронајдени и отстранети дупликати вредности; 6 уникатни вредности остануваат.
  10. Редот кој го содржи вториот запис за Р. Холт со Студентскиот лист на СТ348-252 ќе биде отстранет од базата на податоци.
  11. Кликнете на OK за да го затворите полето за пораки

Во овој момент, примената табела за податоци треба да биде ослободена од сите дупликати податоци.