クラウドサービストラブル

「Wantedly Peope」にScanSnapでまとめて名刺を取り込むと大量の重複が起きてしまう問題

名刺管理については弊社のお客様も頭を悩ませていらっしゃるようです。

デジタルで効率化を図ってきたけど、どうもうまくいかない、しっくりとこない、というのが異口同音です。

特にしごとの効率化のためにScanSnapを活用されているお客様が多い中、名刺管理にも活用する方法はいくつもある中で、現時点で、さらに便利で使い勝手のいいサービスはないものかと、ScanSnapと「Wantedly Peope」との連動について試してみました。

ScanSnapにも名刺管理ソフトは付属していますが、外出先でもスマートフォンで名刺データを参照したいという場合には、名刺管理のクラウドサービスを利用するのが便利です。

そのようにニーズに対しては従来、Evernoteをおススメしてきましたが、名刺管理専用でないため、取っつきにくい印象をお持ちになる方が多いようで、もっとわかりやすい名刺管理サービスを、ということで、改めて探しなおしている所です。

最近話題のWantedly People

クラウド型の”名刺管理”サービスに期待と不安が入り混じる中で、サービス開始以来、いろんな意味で話題になってきている「Wantedly People」。

以前は私自身「これを利用するとプライバシーが守れないかも?」と疑問を持ってしまったため使っていませんでした。

2017年に東証マザーズへの上場を果たしたこともあって、個人情報保護の観点からも「信頼できる体制になったかな?」と思われ、改めて使ってみることにしました。

一度に10枚程度をテーブルの上に適当にならべて、まとめてスマホのカメラで撮影すると、一気に取り込んでくれます。

レイアウトが複雑な名刺は認識に失敗することもありますが、一般的なレイアウトの名刺であれば驚くほど正確に読み取ってくれます。

この文字の認識率が高い点は、AIと機械学習で 画像情報・文字情報を解析しており、名刺の読み込みを重ねることで、認識の制度が向上するようです。

また、名刺情報は、人間の目に触れることがなく、人工知能によって処理されるので、情報が漏れる心配もなく、データは厳重に管理されているようです。

WantedlyにScanSnapを使って名刺を取り込む

さて、ScanSnapの取り込みにも対応しているということで、264枚の名刺を取り込んでみました。

名刺の場合1度で30~50枚程度を高速に両面で取り込みができ、大量の名刺も数分で作業が完了してしまいます。

タテヨコ適当に置いたとしても自動的に回転して取り込まれるのもありがたいです。

#ただし、表面を内側に、裏面を外側に向けるようにして取り込むのがポイントです。

ScanSnapでの取り込みは残念

しかし、残念ながら、ScanSnapで名刺を大量に取り込むと、現時点では問題が発生してしまっています。

30~50枚ずつをまとめて連続して取り込むと、同じ名刺データが大量に重複して取り込まれてしまう現象が起きています。

上の例では1件で65もの同じデータが取り込まれてしまっています。

264枚の名刺が平均で50件に重複して登録されているとすると、13,200件ものデータが登録されてしまっていることになります。

5~6枚ごとに細かくわけて、時間を空けて取り込んでいけば問題は発生しないようですが、それではScanSnapを使う意味がありません。

重複したデータを削除しようにも1件ずつ削除せねばならず、これだけ大量になると無理です。その時点で使うのをあきらめました。

重複するデータを抽出してパージする機能があったり、せめて重複するデータをまとめて削除できたり、さらには全データの消去を行ってリセットができたりすれば、使いようがあるのですが、こうなっては復旧のしようがありません。残念です。

無線LAN使用が前提という残念?

おそらく、「無線LAN」→「インターネット」→「Wantedlyのサーバー」という伝送経路の中で、問題を起こすのは「無線LAN」そして「インターネット回線」ということになるでしょうか。

インターネットでデータを伝送する際には「インターネット・プロトコル(IP)」という方式で、1つのデータを複数のパケットに分割して送信しています。

無線LANで通信状態が不安定になると送信エラーが発生します。インターネット回線が混雑してしまうことでエラーが発生してしまうこともあります。

さらには伝送されるデータが一気にルーターに負荷をかけてしまい、ここでもエラーが発生します。

このように送信エラーとなったパケットは、正常に送信が完了するまで、再送が何度も繰り返される場合もあるわけです。

重複したパケットは受信側で整理することになっており、本来ならば正しいデータとして復元する処理が行われるのでしょうが、ここでも問題が発生しているのでしょうか?

以上については、定かではないですし、あくまでも推測ですが、もしかすると、このようなことが1件の名刺データが65も重複して取り込まれる原因のような気がしています。

別の環境で試してみましたがやはり重複は起きています

改めて、機材を事務所に移動させ、事務所のネットワークで、同じ名刺を同じように取り込んでみました。

重複してしまう件数は大幅に減ってはいますが、それでも数件の重複が起きています。

スマホで数件ずつ、ScanSnapでも数枚ずつ、地道に取り込むならば問題なさそうですが、大量の名刺を一気に取り込むにはリスクがありそうです。

まだ発展途中ですかね?

スマホ版のアプリもそうですが、PC版はさらに、名刺管理においてできることが少なく、ソーシャル・ネットワーク・サービスに力が注がれている印象です。

264枚の名刺を取り込んだだけなのですが、それが重複がひどく、恐らく10,000件を超える状況になってしまっているわけです。

こうなると、動作がとても遅く/重く、並べ替えもかなり時間がかかります。

CSVデータのダウンロードも500枚程度の時は問題なく出力できたのですが、10,000を超える現状では実行されませんし、エラーも返ってきません。

現状では、残念ですが、使用を中断することにしました。

関連記事