研究業績リスト
その他
多様性・被覆性等を考慮した代表解集合を求める情報抽出機構に関する研究
作成日時 04/2023–03/2026
Offer Organization: 日本学術振興会, System Name: 科学研究費助成事業 基盤研究(C), Category: 基盤研究(C), Fund Type: -, Overall Grant Amount: - (direct: 1400000, indirect: 420000)
その他
A Study on Data-Space Generating Operations on Massive Data Platforms
作成日時 04/2012–03/2016
Offer Organization: Japan Society for the Promotion of Science, System Name: Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C), Category: Grant-in-Aid for Scientific Research (C), Fund Type: competitive_research_funding, Overall Grant Amount: - (direct: 2300000, indirect: 690000)
Similarity joins on massive datasets are useful operations to detect many-to-many relationship residing in target datasets. However many join algorithms on various similarity functions are known to have unstable performance on map/reduce systems. The objective of this research is to clarify reasons of this unstablity, and to solve it. To do so, the research proposes two new algorithmic frameworks. One is the hybrid-hash join enhanced with bucket-regrouping techniques, named HSJ+BR. It solves unexpected unbalance between reducers without intermediate mapreduce jobs. The other is called two-stage hash-partitioning strategy. It can greatly reduce the shuffle overhead caused by too much record-replication associated with many similarity join algorithms. Using these two frameworks, it is shown that stable and efficient performance of similarity joins on map/reduce systems (where, as typical cases, m-to-n equi-join and edit-distance join are used) is achieved.
その他
A Study on Database Systems for Multi-Dimensional Web-Structure Mining
作成日時 2009–2011
Offer Organization: Japan Society for the Promotion of Science, System Name: Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C), Category: Grant-in-Aid for Scientific Research (C), Fund Type: competitive_research_funding, Overall Grant Amount: - (direct: 1900000, indirect: 570000)
Web-Community Mining is a significant issue in today's cyberspace technology. One problem is how to find outstanding communities in a big data space, and the other is how to support user-given personalization in the web-community mining function. This research is aimed at solving the latter issue. The proposed solution is a new database system which provides a data-cube query model on a target web-space dataset. Namely, under a given multi-dimensional constraint, the system computes web-community structures under the constraint and returns a ranked list of communities. The proposed data-cube model has three dimensional constraints of FROM-type, TO-type, and the time of a data snapshot. Efficient set-oriented data operations on the data-cube model and their algorithms are also proposed.
その他
A Study on Log-Data Analyzing Functions in Data-Management Systems
作成日時 2005–2006
Offer Organization: Japan Society for the Promotion of Science, System Name: Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C), Category: Grant-in-Aid for Scientific Research (C), Fund Type: competitive_research_funding, Overall Grant Amount: - (direct: 2100000, indirect: -)
Today' s information systems generate massive amounts of various log-data, and there are increasing needs of extracting useful knowledge from the logs and understanding what happen in the target systems. In order to satisfy these needs, this study is focused on extending existing relational database functions, and is aimed at developing efficient database-processing methods for flexible retrieval of log-data sequences, log-data transformation, and log-data analysis. Major results are as follows :
Firstly, we developed a multi-dimensional data cube which supports data-mining in a multi-dimensional space of analysis. This system, named an Itemset cube, enables us to transform a given log-data set into another set of useful granules of information under a data cube model. Secondly, we developed a new efficient search algorithm, named N-OPS, for a given data sequence, by specifying a contiguous sequential pattern as a query. This pattern is a regular expression made of database predicates p(x), where x is a database record and p(x) is a SQL call with respect to x. Because N-OPS allows general database predicates, a wide range of database sequential search tasks can be supported. Our test showed that N-OPS can achieve much less times of predicate invocation than the traditional method based on NFA does. Thirdly, in order to detect a significant region in an itemset cube, we developed a method to apply Multi-Structural database operations to an itemset cube, and showed that this can automatically detect an interesting subsequence in case of computer system logs.
その他
A Study on Utilization of Event-Data Sequences
作成日時 2002–2003
Offer Organization: (株)富士通研究所, System Name: 受託研究, Category: -, Fund Type: -, Overall Grant Amount: - (direct: -, indirect: -)
その他
移動ユーザによるWWW埋め込み型異種情報資源のビュー統合に関する研究
作成日時 1999–2000
Offer Organization: 日本学術振興会, System Name: 科学研究費助成事業, Category: 奨励研究(A), Fund Type: -, Overall Grant Amount: - (direct: 1300000, indirect: -)
近年、複数の自律的な組織によって管理されたWWW埋め込み型情報資源のネットワークが普及するにつれ、それら情報源を移動ユーザが自分の携帯端末を通してアクセスする状況が増えている。本研究では、このような状況において、移動ユーザが自分の持つPDA上で直接的にWWW情報源の統合を行う機構(ナビゲーション型統合)を提案している。提案した統合方式では、WWW情報源のサービス提供機能はリンクとして抽象化され、WWW情報源の出力コンテンツの対応データ項目から別のWWW情報源のサービスを呼び出す形で統合が行なわれる。
平成12年度には、平成11年度に構築したナビゲーション型統合を行うデータモデルの定義と基本システムを拡張し、その適用範囲を広げた。すなわち、従来から提案してきた異種データの競合解決の機能を、複数の異るネットワーク環境上で行えるように拡張した。また、取り扱い可能なWWW情報源の範囲を、半構造文書やJavaアプレットおよびCGI機構のサーバ機能のみから、実行可能コードを含むユーザインタフェース部分にまで広げた。これによって、ナビゲーション型統合の実体化の途中であっても、ユーザとの対話処理が可能になることが可能となった。
上記の方式に基づいて、本システムを実働させる試験環境を構築し、いくつかの典型的な移動ユーザ利用環境の下で評価を行なった。特に、移動ユーザの位置に依存したコンテンツを提供するような情報源を複数用意し、これらを用いて位置依存のコンテンツの統合をユーザの携帯端末上で指示できるようにした。これらの成果により、移動ユーザによる情報源利用環境において提案方式が有用であることを確認した。
その他
類似画像検索におけるウェーブレット変換を用いた自然な質問画像の生成方法
作成日時 1997–1998
Offer Organization: 日本学術振興会, System Name: 科学研究費助成事業, Category: 基盤研究(C), Fund Type: -, Overall Grant Amount: - (direct: 1900000, indirect: -)
画像内容に基づく類似画像検索システムを有効に利用するためには,利用者の意図を適切に反映した問い合わせ画像を生成する機能が重要であると考察し、以下の研究を行った。
1.テクスチャ領域分割のためのウェーブレット変換を用いた特徴量を提案した。提案した特徴量を国立歴史民俗博物館の歴史民俗画像データに対してテクスチャ領域分割を行った結果、良好な領域分割が得られた。
2.テクスチャパターン特徴量を求める過程で得られる量から、テクスチャによる類似画像検索のためのウェーブレット変換を用いた特徴量を定義した。人工画像(180枚)に対して類似画像検索の実験を行った結果、良好な結果が得られた。
3.ウェーブレット分解係数のレベル間および局所領域の相関関係を用いて、解像度の差異に対して頑健なテクスチャ特徴量を提案した。頑健性を評価するために,51種類の布生地を10段階の解像度で撮影したテクスチャ画像510枚のテクスチャライブラリを作製し、類似画検索実験を行ない良好な結果を得た。
4.複数のテクスチャ画像のウェーブレット分解係数に変換を施すことにより新しいテクスチャ生成するテクスチャ合成手法を開発した。
また、合成した新しい画像のテクスチャ特徴量がテクスチャ特徴量空間上のどこに写像されているかを調べ、"自然なテクスチャ"を合成しているかどうかの評価を行なった。
その他
普遍的情報資源ネットワークにおける移動計算機向け仲介者エージェント機構の研究
作成日時 1996–1996
Offer Organization: 日本学術振興会, System Name: 科学研究費助成事業, Category: 奨励研究(A), Fund Type: -, Overall Grant Amount: - (direct: 1000000, indirect: -)
本研究では、普遍的・自然発生的な情報資源からなるネットワークを対象に、永続オブジェクト管理機能を有したスクリプト言語Persistent Perlとその情報検索スクリプトの対話的合成機構とを提案し、その遠隔プログラム機構を使って移動計算機に適した情報探索仲介者機構を実現した。具体的には、Persistent Perlを情報資源の外部仕様記述言語(いわゆるプロセル化)として捉え、任意の情報資源の外部仕様をこの言語でオブジェクト指向関係モデルに従って記述する。移動計算機側の仲介者機構は、移動中に遭遇した情報資源からこの仕様を集めていき、その断片的な仕様の集まりからユーザの指示に沿って新たに検索スクリプトを合成する。本研究では、この方針に沿って以下の成果をあげた:
1:上述した仲介者処理機構を実際に移動型携帯計算機に載せて運用し、情報検索スクリプトを移動計算機側で対話的に合成する機構をPersistent Perlの仕様記述部に導入した。具体的には、スクリプト合成のための項書き換え規則を仕様に含め、遠隔プログラムで移動計算機へ送って検索スクリプトを合成することにした。
2:試験運用では、Java言語による実行可能画像データ、事務データ、World Wide Web探索エンジンの外部仕様を記述し、それらを接続・利用する検索スクリプトを移動計算機側で合成した。また、移動計算機上でこれら仕様を管理・再利用するインタフェース部を試作した。
上記成果により、オブジェクト関係モデルで代表的な情報資源の外部仕様が記述できることがわかり、その結果、移動計算機向けの仲介者機構の基本的機能が実現できた。
その他
作成日時 1995–1996
Offer Organization: Japan Society for the Promotion of Science, System Name: Grants-in-Aid for Scientific Research, Category: Grant-in-Aid for Scientific Research (C), Fund Type: -, Overall Grant Amount: - (direct: 2100000, indirect: -)
The aim of this project is to provide a unifying scheme based on wavelet transform for content-based retrieval of image database. Two main components of the scheme are as follows :
1)Hierarchical decomposition of images using orthogonal discrete wavelet transform (DWT) : DWT decomposes an image into three orientation selective detail images and an approximate image. The decomposition process can recursively be applied to the approximate image to produce the next level of the resolution. Thus we can obtain a pyramid structure of subimages with various resolutions corresponding to the different scales. It should be noted that the pyramid structure is the basis for image processing such as edge extraction, texture extraction, texture segmentation, shape extraction, and so on.
2)Feature extraction : We extract features of an image from the subimages obtained by DWT.For example, we use the higher-order local autocorrelation as features for retrieval by example image, shape, user-constructed sketches and drawings. For retrieval by texture, we proposed new features computed from the wavelet coefficients of detailed subimages. These features are stored in the database.
Based on this scheme, we have developed a prototype system of an image database of the historical objects of various places in Japan. This database includes classical pictures, patterns, and instruments, which are Japanese heritages and/or legacy objects collected in the National Museum of Japanese History.
The system allows similarity retrieval based on example images, user-constructed sketches and drawings, textures, and interactive combinations of these. Then the system supports retrieval by browsing which is needed when users are vague about their retrieval needs or unfamiliar with the information available in the database. Experiment with hundreds of images showed good performance.
その他
大規模データベースを用いた多エージェント型情報システムの行動シミュレーション
作成日時 1995–1995
Offer Organization: 日本学術振興会, System Name: 科学研究費助成事業, Category: 奨励研究(A), Fund Type: -, Overall Grant Amount: - (direct: 900000, indirect: -)
近年の情報システムや社会システムは複数のエージェント達が大規模なデータベースを共有し、その上で自立的に動作する形式でモデル化される。本研究の目的は、過去の履歴データを用いてこの多エージェントシステムの行動をシミュレートする、というデータベースの新しい利用方法を確立することである。次の二点が本年度研究の成果である:
1: 実際のゲーム形式シミュレーションで扱われている多エージェントモデル(例: 都市開発モデルや市場取り引きモデル)を対象に、データベースを用いてその行動をシミュレートする際のモデル記述方式を明らかにしたこと。
→具体的には、対象系が変化していく過程の記述を、「多エージェントによる分散制約充足問題とその実行結果にる内部状態データベースの更新操作」の繰り返しによって行なう、という設計方法を提案した。さらに、この方針に基づいて従来からボードゲームで用いられている多エージェントモデルに対して履歴データベスを使ってそのシミュレーションを行なう事例を示し、本提案方式の有効性を示した(文献2)。
2: 上記1で提案した設計方針に沿って記述された一般的なシミュレーション問題に対し、これを効率良く実行するデータベース処理算法を提案し、処理系を試作して提案算法の有効性を示した。(文献1)。
これら二点の成果により、データベースの新しい利用方法として本研究課題の有用性を主張できる。