コードに一切触れず
データを入手可能
多くのお客様に信頼されています。
Import.ioは世界中で数多のお客様に選ばれ
大規模なWebデータの抽出を実現しています
データがより身近な存在となるよう、サポートいたします。
データ部門はインサイトの作成に20%に費やし
残りはデータのクリーニングとアクセスに費やしています
障害物を回避
キャプチャ、ログイン、複雑なサイトも心配ご無用です。インタラクションモードと洗練されたAIが、最新サイトのクロールをサポートします。
数分でデータ収集を開始
5分以内にエクストラクタを構築して実行します。
必要な場所にデータを提供
Import.ioは、データをJSON、CSV、またはさらなる分析のためのGoogleシートとして配布するプロセスを構築するのに役立ちます。
データ収集の仕組み
サイトのURLを入力
データを抽出するためにエクストラクタを設定
エクストラクタを実行し、データを収集
John T. Shea
CEO & Founder, Momentum Commerce
働き方を自由に選べる
Import.ioのAPIを使用すると、高品質なWebデータの安定したストリームをビジネスプロセス、アプリケーション、分析ツール、可視化ソフトウェアに統合できます。
また、ユーザーインターフェイスで出来ることは、すべてAPIを通じて実行出来ます。
Webデータ抽出を安心安全
そして簡単かつ正確に行うための機能
Import.ioでは、ページからデータを抽出する方法を簡単にご紹介できます。データセットの列を選択し、ページ上の興味のある項目をポイントするだけです。機械学習による自動サジェストを使えば、URLからデータセットまでワンクリックで移動できます。
Import.ioは、データを抽出したすべてのページのスクリーンショットをキャプチャして保存できるため、コンプライアンスと正確性の確保に役立ちます。この機能は、抽出されたデータの監査可能なレコードを作成するため、簡単にアクセス可能で便利です。
複数のページからデータを抽出します。ページ分割されたリストは自動的に検出されますが、学習させるために明示的に「次」のページをクリックすることも可能です。
ページ番号やカテゴリー名などのパターンを使って、必要なURLを数秒で自動生成します。
Webサイト上で実行する必要のあるアクションのシーケンスを記録します。例えば、ページ間の移動、検索語の入力、リストのデフォルトのソート順の変更などです。
Webデータの抽出を「定期的」に実行するよう、予約またはカスタムスケジュールを使用して設定します。
すべてのWebデータと一緒に画像やドキュメントを一括ダウンロード。小売業者はメーカーから商品画像を入手し、データサイエンティストはコンピュータビジョンのトレーニングセットを構築します。
認証されたデータの抽出は、Webサイトにログインした後にのみ利用可能なデータを取得できます。お客様が適切な認証情報を提供すれば、あとはImport.ioが実行します。
エクストラクタを保存するたびに、Import.ioは可能な限り最短時間で実行されるよう自動的にエクストラクタを最適化します。
複数の異なるページで同じエクストラクタを学習します。Webサイトが同じページタイプで異なるデータバリエーションを表示する場合、すべてのバリエーションに対して学習させます。
高度なユースケースに対応する
さらにパワフルな機能
国別での抽出
Webデータの抽出を実行する地域を制御し、価格データも現地通貨で抽出するなど、あらゆる国に対応しています。
PIIのマスキング
Webデータを抽出する際に、個人を特定できる情報(PII)を自動的に削除します。名前、電話番号、住所などのPIIを検出し、再編集することが可能です。
XPath & Regex
XPathとRegExを使用して独自のカスタム抽出ルールを作成します。これは、隠されたデータを取り出したり、高度な設定を行う際に特に役立ちます。