WPS Office立即下載
進階資料處理
Power Query
去重
資料清洗
錯誤排查
自動化
WPS表格

WPS表格Power Query清除重複資料步驟與常見錯誤排查指南

WPS 官方團隊
2025年11月18日
0 次觀看
WPS Power Query, WPS表格去重步驟, Power Query清洗重複資料, WPS Power Query錯誤排查, 批量資料去重教學, Power Query資料型別驗證, 重複資料清除方法, WPS表格進階技巧, 如何修復Power Query錯誤, 資料去重自動化流程
WPS表格 Power Query 清除重複資料功能可一鍵比對多欄位並保留唯一值,適合月報、訂單彙整等場景。本文以 2025 年 10.12 版為基準,拆解「資料→取得與轉換→移除重複」完整路徑,並提供平台差異、常見錯誤碼 0x80070057 與索引錯位的排查步驟,同時點出「何時不該用」與回退方案,讓你在 5 分鐘內完成可稽核的去重流程。

功能定位與變更脈絡

Power Query 在 WPS 表格的定位是「無程式碼 ETL」——Extract(擷取)、Transform(轉換)、Load(載入)。2024 年第四季起,WPS 把原本僅在 Windows 桌面版提供的「取得與轉換」功能下放到 macOS 與 Android 平板,讓用戶能直接連接本機表格、CSV、雲端資料夾,並在查詢編輯器內完成欄位篩選、型別轉換與移除重複。

與傳統「資料→移除重複」相比,Power Query 的差異在於「步驟可回溯」。後者屬於一次性操作,若日後新增資料需重新手動去重;前者則把「來源→動作」寫成查詢步驟,下次僅需重新整理即可同步最新唯一值,適合週期性報表。

從 IT 治理角度來看,「步驟可回溯」也意味著稽核軌跡能被完整保留。當財務或法務單位需要回溯某份報表的產製邏輯時,只要在「套用的步驟」窗格內逐一展開,就能重現當時的資料處理決策,降低口頭說明成本。

操作路徑(分平台)

Windows 桌面版 10.12

  1. 開啟含有重複列的範圍,點選「資料」索引標籤。
  2. 按一下「取得與轉換資料」群組內的「從表格/範圍」。若該範圍尚未格式化為表格,系統會提示轉換,點「確定」。
  3. 查詢編輯器開啟後,按住 Ctrl 選取要比對的欄位(例如「訂單編號+客戶名稱」)。
  4. 在「常用」索引標籤點「移除重複」,右側「套用的步驟」會新增一筆記錄。
  5. 點「關閉並載入至…」→選「表格」→指定現有工作表或新工作表。

若來源為 CSV,可在步驟 2 改選「資料→取得資料→從檔案→從文字/CSV」,其餘流程相同。經驗性觀察:當 CSV 編碼為 UTF-8 with BOM 時,Power Query 可自動偵測分隔符號;若為 UTF-16LE,則需手動切換「地區設定」為 1200 (Unicode),否則中文欄位會被視為二進位亂碼。

macOS 版 10.12

介面群組名稱相同,但「取得與轉換資料」預設收合在「資料工具」下拉選單內,需先點擊展開。其餘步驟與 Windows 一致。值得注意的是,macOS 版不支援 OLE DB 與部分舊式 ODBC 驅動,若公司資料庫僅提供 32-bit 驅動,建議改用 CSV 中轉,或直接於 Windows 端先行落地。

Android 平板/iPad 版

受限螢幕尺寸,WPS 僅提供「精簡查詢」模式。路徑:下方工具列「資料」→「查詢與連線」→「+」→「表格去重」。在此模式下無法同時檢視公式列與資料預覽,若要比對超過三欄,建議回到桌面版。經驗性觀察:Android 版在 8 吋以下裝置會自動隱藏「進階編輯器」按鈕,僅保留「一鍵去重」開關,目的在於降低誤觸率。

例外與取捨

Power Query 的去重邏輯是「完全比對」,也就是大小寫、全形半形、前後空格皆視為不同。若來源混有全形英數,需先在「轉換」步驟使用「格式→清除→清除多餘空格」與「變更小寫」再做移除重複,否則會留下看似相同實則相異的資料列。

另一個常見誤區是把「計算欄位」當作比對條件。舉例:先用「新增欄位→金額*匯率」產生本幣金額,再勾選該欄去重。經驗性觀察顯示,若之後手動改動匯率並重新整理,計算欄位值變動,導致原來被剔除的列重新出現。解法是將「匯率」獨立成參數表,避免把易變動的衍生值當去重鍵。

此外,若來源資料為「多人共同維護的線上問卷」,常因填答者習慣不同而出現「台北市 / 臺北市」這類行政區差異。建議在去重前新增「對照對應表」查詢,利用「合併查詢→模糊比對」將異體字先行正規化,再執行移除重複,可減少 5–8% 的殘留誤判。

常見錯誤碼與排查

0x80070057:參數錯誤

現象:載入時跳出「無法載入查詢,錯誤碼 0x80070057」。多發生在來源範圍被整列選取(例如點選 A:Z),導致空白欄被視為有效資料。驗證:在查詢編輯器預覽底部觀察「空白值」比例,若超過 30% 即可能觸發。

處置:回到「來源」步驟,將語法改為 = Excel.CurrentWorkbook(){[Name="Table1"]}[Content] 或手動框選實際使用範圍,再重新整理。

索引錯位(經驗性觀察)

情境:去重後再使用「VLOOKUP」回寫欄位,發現部分列對應錯誤。原因在於 Power Query 載入時會自動排序,若 VLOOKUP 基於原始列順序,將導致偏移。

驗證:在去重前新增一欄「原始序號」=ROW(),載入後比對該欄即可發現排序差異。

緩解:改用 XLOOKUP 並以唯一鍵(如訂單編號)作為搜尋條件,或於 Power Query 內以「合併查詢」完成對應,避免回寫。

與第三方協同的權限最小化原則

若把查詢檔案放在公司內部 SharePoint,並允許供應商上傳 CSV,可在「資料來源設定」→「隱私等級」把該資料夾設為「公用」,但把目的地報表設為「組織」。如此 Power Query 會強制在載入前隔離資料,防止外部腳本竊取其他連線。

經驗性觀察:若開啟「快速合併」並將所有來源標記為「公用」,可能使含敏感欄位的查詢被外部使用者下載。驗證方式為在另一帳號開啟檔案,查看「查詢&連線」窗格是否出現不該看到的內部資料表。

適用/不適用場景清單

條件 建議 原因
月更 5 萬行以下訂單 適用 查詢載入約 3 秒內完成,無須分表
需即時同步,延遲 < 1 分鐘 不適用 Power Query 重新整理最短 1 分鐘,且無推送機制
來源含 50 欄以上且常增欄 謹慎使用 新增欄位不會自動納入查詢,需手動調整「選擇欄」步驟
需符合個資法去識別化 適用 可在查詢內先執行「雜湊→移除重複→刪除原欄」達到去識別化

最佳實踐檢查表

  • 來源先轉 Excel 表格,避免整欄參照。
  • 新增「原始序號」欄,保留排序依據。
  • 去重前完成資料清理(清除空格、統一大小寫)。
  • 把匯率、稅率等易變參數獨立成外部表格,不混入計算欄。
  • 啟用「快速測量」→「資料列計數」作為載入後的完整性檢核。
  • 每季使用「檔案→資訊→檢查問題」掃描是否有隱藏查詢,減少檔案膨脹。

實務上,建議把上述檢查表製成「範本檔 (.xlt)」並存放於部門共用槽,新報表一律由此範本長出,可確保同仁遵循相同步驟,降低因遺漏「清除空格」而導致的殘留重複。

版本差異與遷移建議

2025 年 8 月更新後,WPS 把 Power Query 引擎從 2021 版升級至 2023 相容模式,支援 LAMBDA 與動態陣列,但舊版檔案若含「合併查詢→完整外部」可能出現「找不到資料源」警告。遷移流程:開啟舊檔→資料→查詢&連線→右鍵「變更資料來源」→把本機路徑改為新資料夾→點選「套用」。經內部 50 份測試樣本,平均花 2.3 分鐘可完成重新對應。

驗證與觀測方法

1. 載入後於狀態列確認「列數」是否與預期唯一值相符。

2. 使用「條件式格式→重複的值」對原始資料快速抽樣,若仍有亮色標記,表示去重條件遺漏。

3. 在查詢編輯器點「進階編輯器」,檢查語法是否含 Table.Distinct 且列出的欄位與需求一致。

提示

若檔案須交付給未安裝新版 WPS 的夥伴,可在「輸出選項」勾選「將查詢結果載入為值」,對方即可在無 Power Query 環境下檢視,但將失去一鍵更新能力。

案例研究

案例 A:零售門市—日結 POS 去重

背景:連鎖咖啡店每日上傳 1.2 萬筆 POS 交易至共用雲端夾,因網路抖動偶有重複上傳。

做法:門市會計於清晨 06:30 開啟 WPS 範本,Power Query 自動合併前日 24 檔 CSV→移除重複(以「門市代碼+交易序號」為鍵)→載入樞紐分析表。

結果:原本人工核對需 25 分鐘,導入後 45 秒完成;重複率從 0.8% 降至 0%。

復盤:初期曾因「交易序號」含前置零被視為文字/數字混用,導致部分重複未被剔除,後續在查詢新增「變更類型→文字」步驟後解決。

案例 B:製造業—供應商對帳

背景:中型電子廠每月接收 300 家供應商對帳單,格式各異(xls、csv、pdf 轉表格),需於 5 個工作天內完成沖銷。

做法:IT 部建立「標準對照表」查詢,先統一料號與幣別,再執行「移除重複」產生唯一發票清單;最後與 ERP 拋轉的 AP 檔進行「合併查詢→反左」找出差異。

結果:對帳週期從 5 天縮至 1.5 天;財務發現 0.02% 重複付款案例,即時追回 38 萬元。

復盤:因部分供應商在備註欄加入「退貨」文字,導致「完全比對」誤判為不同發票,後續改用「排除欄位」僅對「發票號碼+金額」去重,問題排除。

監控與回滾 Runbook

異常信號

  • 載入後列數比預期少 >5%
  • 狀態列出現「資料格式錯誤」
  • 樞紐分析表呈現空值比例異常飆升

以上任一觸發,即進入排查流程。

定位步驟

  1. 開啟「查詢&連線」→雙擊該查詢→檢視「套用的步驟」紅字提示。
  2. 逐步點選「上一個步驟」按鈕,觀察預覽何時開始出現空白。
  3. 若為「來源」步驟報錯,檢查 CSV 編碼或網路磁碟是否離線。
  4. 若為「變更類型」報錯,代表新欄含非預期文字,回到原始檔清理後再重新整理。

回退指令

1. 於「查詢&連線」窗格→右鍵「複製」該查詢作為備份。

2. 點選「復原」按鈕,或直接在「套用的步驟」刪除最近一次修改。

3. 若檔案已無法開啟,使用「檔案→選項→進階→忽略 Power Query 錯誤」暫時停用載入,先搶救其他公式。

演練清單

建議每季執行「沙盒演練」:複製正式檔→故意插入 5% 重複列→觀察同仁能否在 10 分鐘內定位並回滾。演練後記錄耗時與盲點,作為下次教育訓練教材。

FAQ

Q1:為何移除重複後,樞紐分析表合計金額下降?
A:移除重複同時剔除金額列,導致總和減少。
背景:Power Query 會整列刪除,而非僅剔除鍵值;若僅想保留最新一筆,需改用「分組依據→取 MAX 日期」。
Q2:可以只對部分欄位去重嗎?
A:可以,於「移除重複」對話框僅勾選要比對的欄位即可。
背景:未勾選的欄位將保留第一筆出現的值,其餘被捨棄。
Q3:Android 版找不到「進階編輯器」?
A:螢幕寬度不足時,WPS 自動隱藏該按鈕。
證據:於 10 吋 Samsung Tab 可見,8 吋小米平板則無。
Q4:重新整理後,出現「隱私等級」阻擋?
A:因資料來源混用「公用」與「組織」等級。
解法:統一將所有來源設為「組織」或啟用「快速合併」即可暫時繞過。
Q5:能否排程每小時自動重新整理?
A:WPS 桌面版無內建排程器。
替代:利用 Windows 工作排程器呼叫 VBS 腳本開啟檔案→重新整理→儲存→關閉。
Q6:CSV 編碼正確,但中文仍亂碼?
A:可能 BOM 遺失或誤存為 UTF-16BE。
驗證:以記事本開啟另存「UTF-8 含 BOM」即可復現修正。
Q7:Table.Distinct 與 Table.RemoveDuplicates 差異?
A:兩者 M 語言底層相同,僅介面翻譯不同。
經驗:使用「進階編輯器」手寫時,Table.Distinct 可指定可比對文化代碼,適用於土耳其文特殊大小寫。
Q8:可以對資料模型去重嗎?
A:WPS 目前未開放 Power Pivot。
建議:先在 Power Query 層完成去重再載入資料模型,避免關聯錯誤。
Q9:檔案暴增 3 倍大小?
A:可能「查詢快速測量」產生隱藏快取。
處置:檔案→資訊→檢查問題→移除隱藏查詢,即可瘦身。
Q10:macOS 與 Windows 協作時,路徑失效?
A:macOS 不支援 UNC 路徑 \\server\share。
解法:改用 OneDrive 相對路徑,兩平台皆能解析。

術語表

ETL
Extract-Transform-Load,擷取轉換載入流程,見「功能定位」段。
BOM
Byte Order Mark,UTF-8 檔案開頭的 EF BB BF 標記,見「CSV 亂碼」。
M 語言
Power Query 公式語言,副檔名 .pq,見「進階編輯器」。
隱私等級
Public/Organizational/Private,控管跨來源合併,見「協同原則」。
模糊比對
Fuzzy Merge,容錯字元差異,見「異體字案例」。
快速合併
Fast Combine,略過隱私檢查開關,見 FAQ Q4。
LAMBDA
2023 引擎新增的具名公式功能,見「版本差異」。
OLE DB
舊式 Windows 資料連線介面,macOS 不支援,見 macOS 段。
UNC
Universal Naming Convention,\\server\share 格式,見 FAQ Q10。
參數表
獨立存放匯率、稅率等變動值之表格,見「計算欄位誤區」。
沙盒演練
隔離環境中模擬故障,見「監控與回滾」。
VBS 腳本
Visual Basic Script,用於 Windows 排程,見 FAQ Q5。
反左合併
Right Anti Join,只保留右表未匹配資料,見「供應商對帳」。
資料模型
Power Pivot 的關聯式儲存區,WPS 尚未支援,見 FAQ Q8。
0x80070057
Windows 通用參數錯誤碼,見「常見錯誤碼」。

風險與邊界

1. 即時性需求:Power Query 重新整理最短週期 1 分鐘,且無推送,對於證券撮合或 IoT 警報等「秒級」情境不適用,請改用具備串流功能的專用資料庫。

2. 巨量資料:超過 100 萬行時,WPS 採用分頁壓縮,但編輯器預覽仍會載入前 1000 列作為樣本,若去重條件分布於尾部,可能導致誤判;建議先行拆分年份子資料夾,再使用「資料夾合併」分批處理。

3. 特殊字元:土耳其文的大寫「i」會轉為 「İ」,若比對鍵含該字元,需指定文化代碼 tr-TR,否則「DIŞ」與「diş」被視為不同;WPS 目前無 UI 入口,僅能手寫 M 語言。

4. 檔案膨脹:查詢步驟內含「新增複製資料行」且未刪除,會使檔案體積指數成長;經驗性觀察,每多一個未使用的複製欄,1 萬行資料約增加 0.8 MB。

替代方案:若僅需一次性去重,可直接用「資料→移除重複」或 Excel 365 的 =UNIQUE() 動態陣列,犧牲可回溯性以換取即時與輕量。

結語與未來趨勢

Power Query 的去重只是資料流程的起點,卻是營運報表能否自動化的關鍵瓶頸。掌握「先清理、再比對、後載入」三步驟,就能把原本人工 30 分鐘的核對工作縮到 30 秒。展望 2026 路線圖,WPS 官方論壇已預告將加入「Power Query Online」,讓瀏覽器也能執行重新整理,屆時與內部 OA 流程整合將不再需要本地排程腳本。建議現在就把查詢步驟命名與註解養成習慣,未來遷移至雲端時,才能一鍵接軌,享受真正的「零手動」資料生活。