MatsuDB REST API

Download OpenAPI specification:Download

REST API gateway for MatsuDB services providing document intelligence with vector search

Corpus

List all corpus documents

Get a list of all corpus documents in the namespace

Authorizations:

BearerAuth

query Parameters

page_size	integer Default: 20 Page size
page_token	string Page token for pagination

Responses

Response samples

200
400
500

Content type

application/json

{"corpora": [{"blob_uri": "s3://bucket/key",
"corpus_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"corpus_id": "12345",
"created_at": "2025-01-01T12:00:00Z",
"indexation_status": "completed",
"mime_type": "application/pdf",
"original_name": "document.pdf"
}
],
"next_page_token": "eyJwYWdlIjoxfQ==",
"total_count": 42
}

Upload a new corpus document

Upload a document to create a new corpus. Optimized for large file streaming.

Authorizations:

BearerAuth

Request Body schema: multipart/form-data
required

file required	string <binary> Document file to upload
original_name	string Original filename (optional, inferred from file if not provided)
key	string Custom storage key (optional, auto-generated if not provided)
mime_type	string MIME type (optional, inferred if not provided)

Responses

Response samples

201
400
413
422
500

Content type

application/json

{"corpus": {"blob_uri": "s3://bucket/key",
"corpus_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"corpus_id": "12345",
"created_at": "2025-01-01T12:00:00Z",
"indexation_status": "completed",
"mime_type": "application/pdf",
"original_name": "document.pdf"
},
"ok": true
}

Get corpus document by ID

Get details of a specific corpus document by its ID

Authorizations:

BearerAuth

path Parameters

corpus_id

required

string

Corpus ID

Responses

Response samples

200
400
404
500

Content type

application/json

{"corpus": {"blob_uri": "s3://bucket/key",
"corpus_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"corpus_id": "12345",
"created_at": "2025-01-01T12:00:00Z",
"indexation_status": "completed",
"mime_type": "application/pdf",
"original_name": "document.pdf"
}
}

Force reindexation of a corpus

Triggers a forced reindexation of the specified corpus document

Authorizations:

BearerAuth

path Parameters

corpus_id

required

string

Corpus ID

Responses

Response samples

202
400
404
500

Content type

application/json

{"corpus_id": "12345",
"message": "Reindexation triggered successfully",
"status": "pending",
"success": true
}

Nodes

List child nodes

Get a list of child nodes for a given root node (e.g. a corpus)

Authorizations:

BearerAuth

query Parameters

root_node_id required	string Root Node ID (e.g. a corpus id)
page_size	integer Default: 20 Page size
page_token	string Page token for pagination
node_types	string Comma-separated list of node types to filter

Responses

Response samples

200
400
500

Content type

application/json

{"next_page_token": "eyJwYWdlIjoxfQ==",
"nodes": [{"blob_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"blob_uri": "s3://bucket/key",
"classifications": ["[application/pdf]"
],
"created_at": "2025-01-01T12:00:00Z",
"hierarchical_path": "1.2.3",
"metadata": { },
"namespace_id": "namespace-123",
"next_node_id": "12346",
"node_id": "12345",
"node_type": "TEXT",
"parent_node_id": "12344",
"positions": [{"path": "1,2,3",
"payload": "(x0,y0,x1,y1)",
"position_type": "bbox"
}
],
"root_node_id": "12345",
"sparse_vec": "{0:0.5,1:0.3}/250002",
"tags": ["string"
],
"text_content": "Document content",
"text_hash": "abc123",
"token_count": 1000,
"vec": [0
]
}
],
"total_count": 42
}

Get a node by ID

Get details of a specific node by its ID

Authorizations:

BearerAuth

path Parameters

node_id

required

string

Node ID

query Parameters

root_node_id

required

string

Root Node ID (e.g. a corpus id)

Responses

Response samples

200
400
404
500

Content type

application/json

{"node": {"blob_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"blob_uri": "s3://bucket/key",
"classifications": ["[application/pdf]"
],
"created_at": "2025-01-01T12:00:00Z",
"hierarchical_path": "1.2.3",
"metadata": { },
"namespace_id": "namespace-123",
"next_node_id": "12346",
"node_id": "12345",
"node_type": "TEXT",
"parent_node_id": "12344",
"positions": [{"path": "1,2,3",
"payload": "(x0,y0,x1,y1)",
"position_type": "bbox"
}
],
"root_node_id": "12345",
"sparse_vec": "{0:0.5,1:0.3}/250002",
"tags": ["string"
],
"text_content": "Document content",
"text_hash": "abc123",
"token_count": 1000,
"vec": [0
]
}
}

Rules

List rules

List all rules for the current namespace

Authorizations:

BearerAuth

Responses

Response samples

200
500

Content type

application/json

{"rules": [{"filters": [0
],
"namespace_id": "my-namespace",
"trigger_id": "corpus_parsing",
"updated_at": "2025-01-01T12:00:00Z"
}
]
}

Create or update a rule

Create or update a rule for a specific trigger

Authorizations:

BearerAuth

Request Body schema: application/json
required

Rule upsert request

filters required	Array of integers Filter configuration as JSON object
trigger_id required	string Trigger ID to configure

Responses

Request samples

Payload

Content type

application/json

{"filters": [0
],
"trigger_id": "corpus_parsing"
}

Response samples

200
201
400
500

Content type

application/json

{"created": true,
"updated": false
}

Get a rule

Get a specific rule by trigger ID

Authorizations:

BearerAuth

path Parameters

trigger_id

required

string

Trigger ID

Responses

Response samples

200
400
404
500

Content type

application/json

{"rule": {"filters": [0
],
"namespace_id": "my-namespace",
"trigger_id": "corpus_parsing",
"updated_at": "2025-01-01T12:00:00Z"
}
}

Delete a rule

Delete a rule by trigger ID

Authorizations:

BearerAuth

path Parameters

trigger_id

required

string

Trigger ID

Responses

Response samples

200
400
500

Content type

application/json

{"success": true
}

List available triggers

List all available triggers that can be configured

Authorizations:

BearerAuth

Responses

Response samples

200
500

Content type

application/json

{"triggers": [{"filter_config_type": "matsu.rules.v1.CorpusParsingFilterConfig",
"trigger_id": "corpus_parsing"
}
]
}

Get trigger schema

Get detailed schema information for a specific trigger

Authorizations:

BearerAuth

path Parameters

trigger_id

required

string

Trigger ID

Responses

Response samples

200
400
404
500

Content type

application/json

{"schema": {"filter_config_type": "matsu.rules.v1.CorpusParsingFilterConfig",
"trigger_id": "corpus_parsing"
}
}

Search

Perform dense vector search from text

Search nodes using semantic text search (auto-generates dense embeddings)

Authorizations:

BearerAuth

Request Body schema: application/json
required

Dense search request

min_similarity	number [ 0 .. 1 ] Minimum similarity threshold (0.0 to 1.0)
node_types	Array of strings Node types to filter by
query_text required	string Text query to convert to dense embeddings
root_node_ids	Array of strings Root node IDs to search within (as strings)
similarity_metric	string Enum: "cosine" "inner_product" "l2" Similarity metric to use (cosine, inner_product, l2). Defaults to inner_product
top_k	integer >= 1 Maximum number of results to return

Responses

Request samples

Payload

Content type

application/json

{"min_similarity": 0.7,
"node_types": ["string"
],
"query_text": "What is machine learning?",
"root_node_ids": ["string"
],
"similarity_metric": "inner_product",
"top_k": 10
}

Response samples

200
400
500

Content type

application/json

{"results": [{"node": {"blob_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"blob_uri": "s3://bucket/key",
"classifications": ["[application/pdf]"
],
"created_at": "2025-01-01T12:00:00Z",
"hierarchical_path": "1.2.3",
"metadata": { },
"namespace_id": "namespace-123",
"next_node_id": "12346",
"node_id": "12345",
"node_type": "TEXT",
"parent_node_id": "12344",
"positions": [{"path": "1,2,3",
"payload": "(x0,y0,x1,y1)",
"position_type": "bbox"
}
],
"root_node_id": "12345",
"sparse_vec": "{0:0.5,1:0.3}/250002",
"tags": ["string"
],
"text_content": "Document content",
"text_hash": "abc123",
"token_count": 1000,
"vec": [0
]
},
"score": 0.95
}
],
"total_count": 42
}

Perform exact text search

Search nodes using exact text matching (ILIKE)

Authorizations:

BearerAuth

Request Body schema: application/json
required

Exact search request

node_types	Array of strings Node types to filter by
query required	string Text query for exact matching
root_node_ids	Array of strings Root node IDs to search within (as strings)

Responses

Request samples

Payload

Content type

application/json

{"node_types": ["string"
],
"query": "search term",
"root_node_ids": ["string"
]
}

Response samples

200
400
500

Content type

application/json

{"results": [{"node": {"blob_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"blob_uri": "s3://bucket/key",
"classifications": ["[application/pdf]"
],
"created_at": "2025-01-01T12:00:00Z",
"hierarchical_path": "1.2.3",
"metadata": { },
"namespace_id": "namespace-123",
"next_node_id": "12346",
"node_id": "12345",
"node_type": "TEXT",
"parent_node_id": "12344",
"positions": [{"path": "1,2,3",
"payload": "(x0,y0,x1,y1)",
"position_type": "bbox"
}
],
"root_node_id": "12345",
"sparse_vec": "{0:0.5,1:0.3}/250002",
"tags": ["string"
],
"text_content": "Document content",
"text_hash": "abc123",
"token_count": 1000,
"vec": [0
]
},
"score": 0.95
}
],
"total_count": 42
}

Perform sparse vector search from text

Search nodes using text search with sparse embeddings (auto-generates sparse vectors)

Authorizations:

BearerAuth

Request Body schema: application/json
required

Sparse search request

min_similarity	number [ 0 .. 1 ] Minimum similarity threshold (0.0 to 1.0)
node_types	Array of strings Node types to filter by
query_text required	string Text query to convert to sparse embeddings
root_node_ids	Array of strings Root node IDs to search within (as strings)
similarity_metric	string Enum: "cosine" "inner_product" "l2" Similarity metric to use (cosine, inner_product, l2). Defaults to inner_product
top_k	integer >= 1 Maximum number of results to return

Responses

Request samples

Payload

Content type

application/json

{"min_similarity": 0.5,
"node_types": ["string"
],
"query_text": "machine learning algorithms",
"root_node_ids": ["string"
],
"similarity_metric": "inner_product",
"top_k": 10
}

Response samples

200
400
500

Content type

application/json

{"results": [{"node": {"blob_checksum": "7cc1b5cf8a72caa6fc7f6f8aa984f4f834b4b1dc6db2d13ba6be4ad837398a62",
"blob_uri": "s3://bucket/key",
"classifications": ["[application/pdf]"
],
"created_at": "2025-01-01T12:00:00Z",
"hierarchical_path": "1.2.3",
"metadata": { },
"namespace_id": "namespace-123",
"next_node_id": "12346",
"node_id": "12345",
"node_type": "TEXT",
"parent_node_id": "12344",
"positions": [{"path": "1,2,3",
"payload": "(x0,y0,x1,y1)",
"position_type": "bbox"
}
],
"root_node_id": "12345",
"sparse_vec": "{0:0.5,1:0.3}/250002",
"tags": ["string"
],
"text_content": "Document content",
"text_hash": "abc123",
"token_count": 1000,
"vec": [0
]
},
"score": 0.95
}
],
"total_count": 42
}

MatsuDB REST API

Corpus

List all corpus documents

Authorizations:

query Parameters

Responses

Response samples

Upload a new corpus document

Authorizations:

Request Body schema: multipart/form-datarequired

Responses

Response samples

Get corpus document by ID

Authorizations:

path Parameters

Responses

Response samples

Force reindexation of a corpus

Authorizations:

path Parameters

Responses

Response samples

Nodes

List child nodes

Authorizations:

query Parameters

Responses

Response samples

Get a node by ID

Authorizations:

path Parameters

query Parameters

Responses

Response samples

Rules

List rules

Authorizations:

Responses

Response samples

Create or update a rule

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Get a rule

Authorizations:

path Parameters

Responses

Response samples

Delete a rule

Authorizations:

path Parameters

Responses

Response samples

List available triggers

Authorizations:

Responses

Response samples

Get trigger schema

Authorizations:

path Parameters

Responses

Response samples

Search

Perform dense vector search from text

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Perform exact text search

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Perform sparse vector search from text

Authorizations:

Request Body schema: application/jsonrequired

Request Body schema: multipart/form-data
required

Request Body schema: application/json
required

Request Body schema: application/json
required

Request Body schema: application/json
required

Request Body schema: application/json
required