名單一旦重複,寄信會重複寄、統計會灌水、對帳會兜不攏。清掉重複資料看似簡單,但「怎麼算重複」其實要先想清楚,否則可能誤刪該留的資料。
先定義什麼叫重複
清重複前最重要的問題是:以哪幾欄判斷重複?同名同姓不一定是同一人,email 相同才比較可靠;有時要兩三個欄位都相同才算重複。先把判斷標準想清楚,再動手刪除,否則很可能把其實不同的兩筆資料合併掉,這比留著重複更麻煩。
做法一:內建的移除重複
Excel 的「資料」分頁有「移除重複項」功能,勾選要比對的欄位後就會把完全相同的列刪掉。它快又直接,適合判斷欄位單純的情況。缺點是它會直接刪除,無法事先預覽刪了哪些,所以使用前一定要先複製一份原始檔備份。
做法二:用 COUNTIF 先標記再處理
如果你想先看到哪些是重複、再決定怎麼處理,可以用 COUNTIF。例如另開一欄輸入 =COUNTIF(A:A,A2),數字大於 1 的就是重複出現的值。先標記、篩選、人工確認後再刪,比直接移除安全,特別適合重要的客戶或財務資料。
做法三:大量資料用批次工具
當資料來自多個來源、格式又不一致時(有的有空白、有的大小寫不同),內建功能可能判斷不出其實相同的兩筆。Excel Cleaner Pro 這類離線工具會先把空白、格式正規化再比對重複,揪出「看起來不同、其實一樣」的資料。它不是唯一解法,但面對髒資料時可以少踩很多坑。
容易被忽略的隱形重複
很多重複之所以沒被抓到,是因為前後有多餘空白、半形全形不同、或大小寫差異,讓「王小明 」和「王小明」被當成兩個人。處理重複前,先把欄位的空白和格式統一,再比對,才不會漏掉這些隱形重複。先清格式、再去重複,順序很重要。
刪除前的必要備份
不論用哪種方法,刪除是不可逆的,動手前務必另存一份原始檔。建議保留「原始檔」「標記重複的版本」「清理後的版本」三份,萬一發現刪錯,還能回溯。資料整理的原則是寧可多留一份備份,也不要事後才發現少了重要資料。
免費試用 Excel Cleaner Pro:200 列內先清一次,再決定是否升級
免費下載試用 →常見問題
Excel 怎麼快速刪除重複資料?
用「資料」分頁的「移除重複項」,勾選比對欄位即可。但它會直接刪除無法預覽,使用前請先備份。
怎麼先看到哪些是重複再決定?
用 =COUNTIF(A:A,A2),結果大於 1 的就是重複值。先標記、篩選、確認後再刪,比較安全。
為什麼有些重複抓不出來?
通常是前後有空白、半形全形或大小寫不同。先把欄位格式統一,再比對重複,才不會漏掉隱形重複。
資料量很大時怎麼處理比較好?
可用離線批次工具先正規化格式再去重複,揪出看起來不同其實一樣的資料;內建功能仍適用於單純情況。
刪除重複前要注意什麼?
先確定以哪些欄位判斷重複,並務必備份原始檔,因為刪除無法復原。建議保留原始、標記與清理後三個版本。